Open25
VRMとアイテムどちらもそれぞれカメラの動きを追従させたい

人間の体はmediapipeとか使えばすぐできそうだけど、手に持ってるものとかになるとどうすればいいか分からない

landmark detection とかestimationとかで検索するとposeとかhandとかが多すぎてつらい

よさそう

6d object pose とか 6d estimate とかのキーワードの方がよさそう

これめちゃくちゃいろいろ紹介してくれててかなりいい

この動画を見た感じ一番精度よさそうで
しかもDockerで動かせるデモ実装まであるやつ見つけた

なんかわかんないけどここがうまくいってないっぽい

普通にubuntuのイメージっぽいからwgetで直接インストールしてみる
wget -O YCB_Video_Models.zip https://drive.google.com/u/0/uc?id=1gmcDD-5bkJfcMKLZb3zGgH_HUFbulQWu&export=download

うーん、うまくいかない。ブラウザからはダウンロードできたんだけどな。

sshでつないでとりあえずzipファイル渡してみるか

ukfってUnscented Kalman Filterの略か
カルマンフィルタで推定誤差抑えてるだけなら別にこれにこだわんなくてもいいかなー
姿勢推定とりあえずできたら後段で自前ですればいいし

Nividiaのサンプル実装っぽいリポジトリあった

Microsoft

ある程度共通のデータセットとタスクがありっぽい
YCB-VideoとかLineMODとか

で、そのどっちもでベンチマーク1位を出しているのが現状FFB6Dというモデルっぽい

一旦FFB6Dを動かすことに専念してみる

とかいいつつ、超直近で改良版みたいなモデルがでたからこっちにする