🐧

「Geekbench AI」で自作PCのAI性能を測定してみた結果

2024/08/29に公開

前回の記事で「Geekbench AI」のインストールと使用方法までを解説しました。
https://zenn.dev/headwaters/articles/3c4dc41863e0cb

なので今回は、僕の自作PCを「Geekbench AI」で測定してみようと思います。

自作PCのスペック

CPU:12th Gen Intel(R) Core(TM) i3-12100F 3.30 GHz
GPU:NVIDIA GeForce GTX1660 Super
メモリ:24GB

マザボ等を知りたければ以下の記事を探せば載っていると思います。
https://zenn.dev/articles/905766df8004c1/edit

RTX3000系統ほしいなぁ。。。

測定結果

まさかブラウザに出力されるとは。。。

CPU

項目としては以下の内容が出力されます。

  • Image Classification:画像分類
  • Image Segmentation:画像セグメンテーション
  • Pose Estimation:ポーズ推定
  • Object Detection:物体検出
  • Face Detection:顔検出
  • Depth Estimation:深度推定
  • Style Transfer:スタイル転送
  • Image Super-Resolution:スーパーイメージ解像度
  • Text Classification:テキスト分類
  • Machine Translation:機械翻訳

そして各項目に単精度(single-precision)、半精度(half-precision)、量子化(quantized)データの3つを出力する。

ONNX -> CPU

測定時間おおよそ5分


。。。。。
。。。。。

いやわからんて!!!!
スコア高いんか低いかわからんわ。。。。。

なのでChatGPTに丸投げしました。

以下ChatGPTから引用

  • 総合スコア評価:
    Single Precision Score (1490): 単精度(FP32)の計算における性能を示しています。一般的に、画像処理など精度が必要なタスクで用いられます。
    Half Precision Score (537): 半精度(FP16)の計算性能を示しており、性能は高精度よりは低いですが、速度は向上するためリアルタイムアプリケーションなどに使用されます。
    Quantized Score (2236): 量子化された計算(INT8など)の性能を示しています。精度が若干落ちる代わりに、計算速度が向上するため、モバイルやエッジデバイスでのAI推論でよく使用されます。

  • ワークロード別評価:
    各ワークロードにおいて測定される項目としては、「Accuracy(精度)」「Score(スコア)」「IPS(推論毎秒)」があり、これらの組み合わせで性能が判断されます。

  • Image Classification(画像分類):
    精度はほぼ100%に近く、スコアやIPSもまずまずの数値です。特にQuantizedのスコアが他より高いことから、量子化されたモデルでの性能が強みです。

  • Image Segmentation(画像分割):
    精度は良好ですが、IPSは他のワークロードに比べて低めです。特にQuantizedではスコアは高いものの、速度の改善が期待できます。

  • Pose Estimation(ポーズ推定):
    Quantizedでのスコアが非常に高いですが、IPSは低め。これは、精度が少し落ちる代わりに高スコアを維持できるためです。

  • Object Detection(物体検出):
    全体的に良好ですが、Quantizedで精度が少し低下する傾向があり、これが限界点として考えられます。

  • Face Detection(顔検出):
    高い精度とスコアが出ており、Quantizedでの性能も良好。リアルタイム用途には向いています。

  • Depth Estimation(深度推定):
    単精度で非常に高いスコアが得られていますが、Quantizedでは精度が落ちる傾向があります。

  • Style Transfer(スタイル変換):
    Quantizedが特に高いスコアを示しており、リアルタイム処理に強いです。

  • Image Super-Resolution(画像超解像):
    全体的にバランスが良く、Quantizedでの速度が特に優れています。

  • Text Classification(テキスト分類):
    単精度のスコアは良好で、特に高速処理が求められる半精度や量子化の性能も平均的です。

  • Machine Translation(機械翻訳):
    単精度でのスコアは比較的良好ですが、量子化されたモデルでは精度が大きく低下しており、これは改善の余地がありそうです。

総合評価:
Geekbench AIの結果から、特に量子化モデルの性能が強調されていますが、タスクによって精度の低下が見られる場合があるため、用途に応じたモデルの選定が必要です。画像処理系のタスクに強い傾向があり、特にリアルタイム処理が求められる場面で有用です。機械翻訳などの言語処理では、量子化の精度が若干落ちる点に注意が必要です。


Intel Core i3-12100Fは、シングルスレッド性能がまあまあ高いのでエッジデバイスに向いている、みたいな評価ですかね。
ただ、マルチタスクがかなり苦手なので高負荷な作業には耐えられないです。

OpenVINO -> CPU

測定時間おおよそ3分
Intelが開発したものなのか少し測定時間が早く、測定結果が段違いに高かったです。


以下ChatGPTから引用

  1. 量子化(INT8)の優位性
  • 評価: Quantized Scoreが6417と非常に高く、特に量子化モデルを使うワークロードで優れたパフォーマンスを示しています。例えば、Style TransferやPose Estimationなどの複雑なタスクで、INT8での推論が他の精度モードを大きく上回るスコアを出しています。
  • 適性: リアルタイム性と効率性が重要なエッジコンピューティングやリソースの限られたデバイスに適しています。
  1. 単精度(FP32)と半精度(FP16)のバランスの良い性能
  • 評価: Single PrecisionとHalf Precisionのスコアがほぼ同等で、それぞれ2445と2465と高い値を示しています。特に、ほとんどのタスクで100%の精度が達成されており、信頼性の高い推論が可能です。
  • 適性: FP32とFP16のスコアが近いことから、精度を犠牲にせずに高速化が可能であることを示しています。これにより、リアルタイム推論が求められるAIアプリケーションに最適です。
  1. 各ワークロードでのスコアと応答速度(IPS)
  • 評価:
    • Image Classification (Q): スコア4108、764.0 IPS。高速かつ精度の高い分類タスクに適しています。
    • Pose Estimation (Q): スコア11278、13.2 IPS。ポーズ推定の高スコアは、スポーツ解析や動作認識に有用です。
    • Style Transfer (Q): スコア30756、39.7 IPS。スタイル変換が非常に高速で、リアルタイムのビジュアルエフェクトに向いています。
  • 適性: これらの高いスコアは、リアルタイム処理や大量の推論が必要なアプリケーション(例えば、映像処理や監視システムなど)で有用です。
  1. 高い精度を保った推論
  • 評価: ほとんどのタスクで98%以上の精度が保たれており、特にINT8でも精度低下が少ないのは大きな強みです。
  • 適性: 精度が要求される医療分野やセキュリティ、品質検査など、信頼性が求められる領域でも利用可能です。

Image ClassificationやPose Estimationのスコアが高いので、画像認識やリアルタイムのスポーツ選手の動きの解析とかに使えそうですね。

GPU

測定時間おおよそ1分30秒



以下ChatGPTから引用

GTX 1660 Superの測定結果の評価

  • 全体的なAI性能
    特にシングル精度(SP)のスコアが高く、GPUの演算能力を活かして高い精度の推論が求められるタスクに適していることを示しています。量子化推論(Q)はCPUに比べてやや低めですが、精度を落とさずに性能を発揮しています。

  • 画像分類(Image Classification)
    非常に高速な推論が可能で、精度も100%を保っています。これはリアルタイムの画像分類に最適で、監視カメラ、顔認識、品質検査などに活用できます。

  • 画像セグメンテーション(Image Segmentation)
    SPでのスコアが高く、セグメンテーションタスクにおいて高精度の解析が可能です。医療画像解析や自動運転のセンサー情報処理など、細かな画像分割が求められる分野での活用が考えられます。

  • ポーズ推定(Pose Estimation)
    特にSPのスコアが非常に高く、ポーズ推定における計算能力が強力です。スポーツ分析、エンターテインメントのモーショントラッキング、リハビリテーションの支援システムに応用可能です。

  • オブジェクト検出(Object Detection)
    SPのスコアと推論速度が高いため、物体検出の精度と速度が優れています。セキュリティシステムや産業用ロボットの視覚システムに適しています。

  • スタイル変換(Style Transfer)
    SPのスコアが非常に高く、リアルタイムでの映像編集やエフェクトの適用に適しています。動画配信やゲームでのリアルタイムレンダリングにも向いています。

  • 画像超解像(Image Super-Resolution)
    高速な超解像処理が可能で、低解像度画像の品質改善や拡大処理に有効です。監視カメラの映像品質向上や古い映像の復元にも活用可能です。

  • テキスト分類・機械翻訳(Text Classification & Machine Translation)
    テキスト処理のスコアは画像処理ほど高くないですが、一般的な自然言語処理タスクには十分な性能があります。チャットボット、テキスト解析ツール、翻訳アプリなどに使用可能です。


中古1万円で手に入れたGTX1660Superですが、Pose EstimationやStyle Transferが高いので
ゲームやスポーツ選手の動きの解析に向いているのかなと思います。
ただGTX 1660 Superはハイエンドではない(中の中くらい?)ので、めちゃくちゃスコアが高いようには思えなかったです。

まとめ

途中少し取り乱しましたが、ChatGPT君のおかげでできることが可視化されました。
このスコアを指標にCPU、GPUの購入を検討してもよいかもですね。

PCだけでなくiOS/iPadOS、Androidでも測定できるみたいなのでダウンロードして測定してみてください。
良ければこの記事のコメントにも送ってください。
https://www.geekbench.com/ai/

おまけ

ニュージーランドで最小級、最古のペンギンの化石を発見されたそうです。
体高30-35センチメートル、体重約1キログラムと推定されてコガタペンギンと同じサイズ感ですね。
ニュージーランドのカンタベリー地方で発見されたらしく、ラグビープレイヤーとしては親近感しかわきません🏉
https://mainichi.jp/maisho/articles/20240827/kei/00s/00s/016000c

愛知県南知多町の日間賀島のビーチで8月25日、「出張動物園」にいた劇団ペンダーズ様のペンギンが脱走してしまったようです。
絶滅危惧種であるケープペンギンが脱走してしまったようなのですが、一時的にGPSのタグを付けてイベントを行うような対策はしちゃだめなんですかね。。。。
法律とかストレスとかコストの面とか、、、、、あるとは思うんですけどそのあたりしっかり管理してあげたいですね。
人間を恋愛対象としてみることもあるらしいので、何事もなく帰ってきてほしいものです。
https://news.yahoo.co.jp/articles/40e6ad218b90a32f72109aed71237c1c76b47ced

ヘッドウォータース

Discussion