BMVC2024に参加した
11/25-28の期間でイギリス・スコットランドのグラスゴーで開催されたBritish Machine Vision Conference (BMVC)2024に参加したので簡単に感想などをまとめます. なお, 私は26・27しか参加してないです. 適宜更新するモチベーションはありますが, 更新はcode coming soonと同じくらいの期待感です.
ちょっと採択論文のタイトルを分析した程度で特に有益な話はしてないです.
BMVCとは
British Machine Vision Association (BMVA)によって毎年行われている (主に) computer visionの国際会議です. 今年は35回目の開催でグラスゴーで行われています. グラスゴーでの開催は1991年以来33年ぶりです. Google Scholarのランキングを見ると, h5-indexは65でComputer Vision分野では14位です. CORE RankはAです. 今年は1020件の投稿に対して264件の採択なので25.88%の採択率となります.
また, 以下の記事にあるように昨年度はrebuttalがあったようですが今年はありませんでした (OpenReviewで提出したら後日査読結果と採択可否が通知される形です).
会議名にcomputer visionとあるのでCV分野だけと思いがちですが, 一応機械学習全般も扱っているようです. CFPにあるトピックは以下の通りです. 発表を見た範囲ではほぼ全てCVだったと思いますが...
- 3D from X
- 3D Shape modeling and processing
- Action and event understanding
- Adversarial attack and defense
- Architecture and Space Design
- Biometrics
- Brave new ideas (not beating SOA but a new appraoch, theory, niche)
- Computational Photography and Photogrammetry
- Computer vision theory
- Datasets and Evaluation
- Deep learning architectures and techniques
- Document analysis and understanding
- Embodied vision: Active agents; simulation
- Explainable AI
- Fairness, privacy, ethics, social-good, transparency, accountability in vision
- Generative models
- Humans: Face, Gestures, Pose and Body Movement
- Human-in-the-loop computer vision
- Image Retrieval
- Low-level and Physics-based Vision
- Machine learning (other than deep learning)
- Medical and Biological Image Analysis
- Motion estimation and tracking
- Multimodal learning
- Recognition for X
- Representation Learning
- RGBD sensors and analytics
- Scene Analysis and Understanding
- Segmentation, grouping and shape analysis
- Self-, semi-, meta-, unsupervised learning
- Transfer, low-shot, continual, long-tail learning
- Video analysis and Understanding
- Vision and audio
- Vision and graphics
- Vision and language
- Vision and robotics
- Vision applications and systems
- Visual reasoning and logical representation
Brave new ideasとは, いわゆるSoTA競争からの脱却を目的としたもので, 目新しさや斬新な問題設定であることが求められます.
発表はOralとPosterに分かれているように見えますが, Oralの研究もPoster発表が義務付けられていますので全ての研究がPoster発表で見ることができます.
BMVC2024について
実際にどのような論文が多かったのかWord Cloudで見てみます.
Vision系の会議なだけあってVisionに関するフレーズが多く出ています. 続いて, stop wordを除いた状態で出現単語の上位30件を見てみます.
モダリティではimage, 3D, gaussian (splatting?), videoの順かと思われます. また, タスクとしてはdetectionが最も多く, segmentation, estimation, recognitionと続いているように見えます.
何をdetection, estimation, recognitionしているのか気になるので調べてみると, detectionの多くはobject detection, anomaly detectionでした. またestimationはpose estimationでの使用が最も多かったです. その中でも(2D/3D) Human Poseがほとんどです. recognitionはこれといって突出するものはなく, ばらけていました.
同じCV系でもCVPRとは少し流行りが異なりそうです. 単純に流行りが遅れている可能性がありますし, 計算資源を確保できるならCVPR/ECCV/ICCVに出すでしょう.
気になったもの
まだポスターを見ただけですが個人的には以下の研究が気になりました (内容が気になっただけで優れていたとか劣っていたとかではないです).
Explaining Multi-modal Large Language Models by Analyzing their Vision Perception
Prompt Generation Networks for Input-Space Adaptation of Frozen Vision Transformers
採択論文・そのポスターやサマリービデオなどはproceedingsから確認できます.
best poster
best poster awardは以下の論文のようです.
雑多な感想
学会について
発表件数が少ないので会場に朝から夕方 (とは言いつつ16時前に日の入りなので終わると夜です)まで居れば全部の研究を見て回る時間があるのでとてもいいと思いました. 私は2023・2024とJSAIでも参加・発表しているのですが, JSAIは口頭発表が多いのでどうしてもカバーできないです.
グラスゴーについて
単純にグラスゴーは遠いです. 羽田からロンドン (LHR) を経由するルートで行きましたが, 地政学的な理由でアラスカ上空を通る航路になっていて, 調べてみると往路は12時間前後だったのが15時間前後になっているようです. LHR経由だとそこから国内線に乗り継ぎますがこちらは1時間半くらいだったと思うので楽です. 気温は冬の寒い日の東京といった感じですが, 28日はかなり冷え込んで氷点下予想でした. あとは市街地は坂が多く, 急なものもあって徒歩で色々移動するのは結構大変かなとも思います.
物価は結構高く, 元々の高さに加えて円安を強く実感しました. 一応羽田空港で少しだけ現金を用意しましたが使わなければならない場面はほぼなく, 大体キャッシュレスでした. スーパーであるtescoや空港の一部店舗は現金払いが可能なのと, 観光地なんかである寄付のボックスは現金オンリーっぽい気がします.
2025
来年はsheffieldで行われるようです. マンチェスターの近くでグラスゴーよりは暖かそうです.
Discussion