😽
魂を削って作られた爆速高精度PINTOモデルを試す
爆速高精度PINTOモデル
これです。
試したら爆速かつ高精度で思わず笑っちゃいました。
動画はこちらです。
衝撃的だったので、簡単に動かし方をメモしておきます。
動かし方
Mac
カメラ付きのMacbook Airで動かしました。Pythonの環境構築はMiniForgeを使って、Python3.8の仮想環境をつくります。Docker使わないのは、カメラがややこしいからです(カメラ無しならDockerを使うと思います)。以下記事を参考にセットアップしてください。
MiniForgeセットアップ後、以下コマンドでセットアップできると思います。
$ conda activate python38
$ pip install onnxruntime
$ pip install opencv-python
$ wget https://raw.githubusercontent.com/PINTO0309/PINTO_model_zoo/main/425_Gold-YOLO-Body-Head-Hand/demo/demo_goldyolo_onnx.py
$ wget https://raw.githubusercontent.com/PINTO0309/PINTO_model_zoo/main/425_Gold-YOLO-Body-Head-Hand/download_n.sh
$ bash download_n.sh
$ python demo_goldyolo_onnx.py -m gold_yolo_n_body_head_hand_post_0461_0.4428_1x3x480x640.onnx -v 0
以下みたいなエラーが出たらonnxruntimeが古いです。
onnxruntime::Model::Model Unsupported model IR version: 9, max supported IR version: 8
以下コマンドで最新版(1.16以上)を入れましょう。
$ pip uninstall onnxruntime
$ pip install onnxruntime
Linux/Raspberry Pi
多分Linuxでも動くと思います。以下とか参照ください。
ラズパイでも動くはずです。すでにタイムライン上で動作報告がちらほら。
まだ動作確認していませんが、動かしてみたい人は拙作「エッジAIコンピュータビジョン入門」を参考にしてみてください。
まとめ
あまりにすごかったので雑に動かし方をメモっちゃいました。魂を削ってアノテーションしたことが伝わる良いモデルですね。
人と手を検出するという、アプリケーションとしてはありふれたものなのですが、ここまで高性能(精度が高く高速)だと、全く違ったユーザー体験になりますね。
応用して何か作ってみたくなりました。そのときのためのメモです。
参考リンク
関連記事
Discussion