🔍

面白そうな論文紹介【ECCV2024】

2025/03/04に公開

ECCV2024の論文で、個人的に面白いと感じた・惹きつけられた論文をテンポよく紹介していきます。
(ECCVは、2024年9,10月に開催されたComputer Vision・AI分野でのトップカンファレンスです)

論文紹介

Sapiens: Foundation for Human Vision Models

4つの重要なヒューマンビジョンタスク(2Dの姿勢推定,身体部分のセグメンテーション,深度推定,法線予測)を対象としたモデル。
[arXiv][Code][Demo][Project Page]

300億枚以上の人間の画像で事前学習し、未知の画像の推定にも優れている手法。

エンコーダ(入力画像からモデルが理解するために情報を落とし込む段階)とデコーダ(落とし込んだ情報から出力する段階)を異なるタスク間で統一し,デコーダ部分の微調整だけで適応可能にした。

デモも4つの出力タイプ全てを試せる。精度すごい!

画像生成で作成した男性の写真を入力して、Normalで出力したもの

EgoPoser: Robust Real-Time Egocentric Pose Estimation from Sparse and Intermittent Observations Everywhere

[arXiv][Code][Project Page]

https://x.com/i/status/1861095701599457684

Discussion