🔍
面白そうな論文紹介【ECCV2024】
ECCV2024の論文で、個人的に面白いと感じた・惹きつけられた論文をテンポよく紹介していきます。
(ECCVは、2024年9,10月に開催されたComputer Vision・AI分野でのトップカンファレンスです)
論文紹介
Sapiens: Foundation for Human Vision Models
4つの重要なヒューマンビジョンタスク(2Dの姿勢推定,身体部分のセグメンテーション,深度推定,法線予測)を対象としたモデル。
[arXiv][Code][Demo][Project Page]
300億枚以上の人間の画像で事前学習し、未知の画像の推定にも優れている手法。
エンコーダ(入力画像からモデルが理解するために情報を落とし込む段階)とデコーダ(落とし込んだ情報から出力する段階)を異なるタスク間で統一し,デコーダ部分の微調整だけで適応可能にした。
デモも4つの出力タイプ全てを試せる。精度すごい!
画像生成で作成した男性の写真を入力して、Normalで出力したもの
EgoPoser: Robust Real-Time Egocentric Pose Estimation from Sparse and Intermittent Observations Everywhere
[arXiv][Code][Project Page]
Discussion