🙆
BMVC2024に参加した

2024/12/03に公開
11/25-28の期間でイギリス・スコットランドのグラスゴーで開催されたBritish Machine Vision Conference (BMVC)2024に参加したので簡単に感想などをまとめます. なお, 私は26・27しか参加してないです. 適宜更新するモチベーションはありますが, 更新はcode coming soonと同じくらいの期待感です.
ちょっと採択論文のタイトルを分析した程度で特に有益な話はしてないです.

 BMVCとはBritish Machine Vision Association (BMVA)によって毎年行われている (主に) computer visionの国際会議です. 今年は35回目の開催でグラスゴーで行われています. グラスゴーでの開催は1991年以来33年ぶりです. Google Scholarのランキングを見ると, h5-indexは65でComputer Vision分野では14位です. CORE RankはAです. 今年は1020件の投稿に対して264件の採択なので25.88%の採択率となります.
また, 以下の記事にあるように昨年度はrebuttalがあったようですが今年はありませんでした (OpenReviewで提出したら後日査読結果と採択可否が通知される形です).
https://note.com/brainy_hebe631/n/n683672b15690
会議名にcomputer visionとあるのでCV分野だけと思いがちですが, 一応機械学習全般も扱っているようです. CFPにあるトピックは以下の通りです. 発表を見た範囲ではほぼ全てCVだったと思いますが...
3D from X
3D Shape modeling and processing
Action and event understanding
Adversarial attack and defense
Architecture and Space Design
Biometrics
Brave new ideas (not beating SOA but a new appraoch, theory, niche)
Computational Photography and Photogrammetry
Computer vision theory
Datasets and Evaluation
Deep learning architectures and techniques
Document analysis and understanding
Embodied vision: Active agents; simulation
Explainable AI
Fairness, privacy, ethics, social-good, transparency, accountability in vision
Generative models
Humans: Face, Gestures, Pose and Body Movement
Human-in-the-loop computer vision
Image Retrieval
Low-level and Physics-based Vision
Machine learning (other than deep learning)
Medical and Biological Image Analysis
Motion estimation and tracking
Multimodal learning
Recognition for X
Representation Learning
RGBD sensors and analytics
Scene Analysis and Understanding
Segmentation, grouping and shape analysis
Self-, semi-, meta-, unsupervised learning
Transfer, low-shot, continual, long-tail learning
Video analysis and Understanding
Vision and audio
Vision and graphics
Vision and language
Vision and robotics
Vision applications and systems
Visual reasoning and logical representation
Brave new ideasとは, いわゆるSoTA競争からの脱却を目的としたもので, 目新しさや斬新な問題設定であることが求められます.
発表はOralとPosterに分かれているように見えますが, Oralの研究もPoster発表が義務付けられていますので全ての研究がPoster発表で見ることができます.

 BMVC2024について実際にどのような論文が多かったのかWord Cloudで見てみます.
Vision系の会議なだけあってVisionに関するフレーズが多く出ています. 続いて, stop wordを除いた状態で出現単語の上位30件を見てみます.
モダリティではimage, 3D, gaussian (splatting?), videoの順かと思われます. また, タスクとしてはdetectionが最も多く, segmentation, estimation, recognitionと続いているように見えます.
何をdetection, estimation, recognitionしているのか気になるので調べてみると, detectionの多くはobject detection, anomaly detectionでした. またestimationはpose estimationでの使用が最も多かったです. その中でも(2D/3D) Human Poseがほとんどです. recognitionはこれといって突出するものはなく, ばらけていました.
同じCV系でもCVPRとは少し流行りが異なりそうです. 単純に流行りが遅れている可能性がありますし, 計算資源を確保できるならCVPR/ECCV/ICCVに出すでしょう.
https://research-p.com/column/1889

 気になったものまだポスターを見ただけですが個人的には以下の研究が気になりました (内容が気になっただけで優れていたとか劣っていたとかではないです).
Explaining Multi-modal Large Language Models by Analyzing their Vision Perception

https://arxiv.org/abs/2405.14612
Prompt Generation Networks for Input-Space Adaptation of Frozen Vision Transformers

https://arxiv.org/abs/2210.06466
採択論文・そのポスターやサマリービデオなどはproceedingsから確認できます.
https://bmvc2024.org/proceedings/

 best posterbest poster awardは以下の論文のようです.
https://arxiv.org/abs/2408.03790
https://x.com/WeiLinCV/status/1862566145892491447

 雑多な感想
 学会について発表件数が少ないので会場に朝から夕方 (とは言いつつ16時前に日の入りなので終わると夜です)まで居れば全部の研究を見て回る時間があるのでとてもいいと思いました. 私は2023・2024とJSAIでも参加・発表しているのですが, JSAIは口頭発表が多いのでどうしてもカバーできないです.

 グラスゴーについて単純にグラスゴーは遠いです. 羽田からロンドン (LHR) を経由するルートで行きましたが, 地政学的な理由でアラスカ上空を通る航路になっていて, 調べてみると往路は12時間前後だったのが15時間前後になっているようです. LHR経由だとそこから国内線に乗り継ぎますがこちらは1時間半くらいだったと思うので楽です. 気温は冬の寒い日の東京といった感じですが, 28日はかなり冷え込んで氷点下予想でした. あとは市街地は坂が多く, 急なものもあって徒歩で色々移動するのは結構大変かなとも思います.
物価は結構高く, 元々の高さに加えて円安を強く実感しました. 一応羽田空港で少しだけ現金を用意しましたが使わなければならない場面はほぼなく, 大体キャッシュレスでした. スーパーであるtescoや空港の一部店舗は現金払いが可能なのと, 観光地なんかである寄付のボックスは現金オンリーっぽい気がします.

 2025来年はsheffieldで行われるようです. マンチェスターの近くでグラスゴーよりは暖かそうです.
BMVCとは

BMVC2024について

気になったもの

best poster

雑多な感想

学会について

グラスゴーについて

2025

Discussion