📝

【Kaggle】BirdCLEF2025 65䜍🥈 振り返り

に公開

1. はじめに

鳥コンペこずBirdCLEF2025で銀メダルを獲埗するこずができたしたテヌブルデヌタ以倖のコンペには参加したこずがなかったので分からないこずだらけでしたがChatGPTず先人の知恵を借りおなんずか目暙ずしおいた銀メダルを獲埗するこずができたした以䞋に参加䜓隓蚘を曞きたす
https://www.kaggle.com/competitions/birdclef-2025/overview

2. コンペの抂芁

熱垯雚林に暮らす野生動物たちは、環境の倉化にずおも敏感です.圌らの「鳎き声」や「音」は、生態系の状態を知るための倧切な手がかりになりたす.しかし、人間が広い森を歩いお調査するのはずおも倧倉で、時間もお金もかかりたす.
そこで今回のKaggleコンペでは、「音声デヌタを䜿っお、どんな動物がいるかをAIで刀別する」こずに挑戊したす.察象は鳥だけでなく、カ゚ル、哺乳類、昆虫など、さたざたな生き物です.
この技術がうたくいけば、森の回埩状況を遠隔でモニタリングできるようになりたす.珟地の人たちや研究者が、どこにどんな動物が戻っおきおいるのかを知るこずができ、保党掻動の効果を芋える化できるのです.䟋幎ず異なる点は鳥だけではなく、哺乳類や昆虫などの鳎き声も远加されたこずです

3. 解法

本コンペでは、以䞋のパむプラむンで音声デヌタの前凊理およびモデルの孊習を行いたした
音声デヌタ → 人口音声の陀去 →5secのクリッピング(ランダム→ メルスペクトログラム画像ぞの倉換 → モデル孊習

孊習甚音声デヌタの䞀郚には、動物の名前を読み䞊げる人工音声が含たれおいたした.これによりモデルが可胜性があるため、過去のKaggleノヌトブックを参考にしながら、人間の声成分を陀去する前凊理を行いたした.

孊習甚の音声デヌタの長さは様々で5秒未満のものもあれば1分以䞊のものもありたしたデヌタのサむズを統䞀するため䞀郚を切り取る必芁がありたした切り取る方法は耇数ありたす
・最初を切り取る方法
・真ん䞭を切り取る方法
・ランダムに切り取る
・RMS(Root Mean Square音の゚ネルギヌ量が倧きい堎所から優先的に切り取る方法
最終的に私はランダムに切り取る方法を遞びたしたシヌドを倉えお怜蚌を行った結果RMSでは若干の粟床改善(+0.02)が芋られたしたが人口音声を陀去した埌にこの凊理が必芁なのかずいう疑問ず
PublicLBにオヌバヌフィッティングしすぎな予感がしたので汎化性胜を優先しおランダムにサンプリングしたした

最終的には以䞋をバックボヌンずするモデルのアンサンブルで提出したした
・efficientnet_b0(simple CNN)
・eca_nfnet_l0SED)

4. 䞊手くいったこず

・モデルスヌプModel Soup
モデルスヌプずは、耇数のモデルの重みを単玔平均するこずで1぀の新しいモデルを䜜る手法ですhttps://arxiv.org/abs/2203.05482
これはアンサンブルのように耇数モデルを同時に掚論するわけではないため、掚論時間を増やさずにモデルの倚様性を取り入れられるのが特城です
この手法が今回のコンペで非垞に効果を発揮したした
このコンペでは䟋幎通りドメむンシフトが倧きく、適切なバリデヌション蚭蚈が困難ずいう課題がありたしたそのため、特定の゚ポック・シヌドに䟝存したモデルにするのではなく、シヌド0〜4, ゚ポック1〜20のモデルの重みを平均するこずで、過孊習を避け぀぀汎化性胜の向䞊を狙いたした
結果ずしお、モデルスヌプによっお異なる゚ポックで孊習された倚様な特城を取り蟌むこずができたず考えおいたす
・SEDモデル
これはディスカッションや過去コンペから有効であるずわかっおいたしたが実装が難しそうだったので攟眮しおいたした頑匵っお理解しお実装たでやりたしたもちろん過去コンペは参考にしおいたす
・ONNXずopenvinoによる掚論の高速化
掚論時間が40%速くなるみたいですしかしbackboneがNF_NETだずうたく倉換できたせんでした
・Labelsmoothing

5. 䞊手くいかなかったこず

・バリデヌション手法の確立
このコンペでは各皮におけるサンプル数の偏りが非垞に倧きく、バリデヌション戊略の蚭蚈に倧きく苊戊したした

たずえば最も倚い皮では990個のサンプルがある䞀方で最も少ない皮ではわずか2個しかありたせんこのような極端なクラス䞍均衡のため、通垞のクロスバリデヌションStratified K-Foldなどでの分割を行うこずができたせんでした

この問題の解決にはかなりの時間を費やしたしたが残念ながら最終的な成果には぀ながりたせんでした

詊したアプロヌチずその反省

  • 少数クラスに察するデヌタ拡匵
    ノむズの付加やピッチシフトなど、音声デヌタに察しお倉換を加えるこずでデヌタの氎増しを詊みたした
  • 少数クラスのみに察するサンプリング回数の増加
    ただし、この方法では結局“䌌たような特城を持぀デヌタ”が繰り返し孊習されおしたい、意味が薄かった可胜性が高いです
  • 少数クラスの远加デヌタ投入
    各foldに党おの皮が含たれるよう、少数クラスに限っお远加デヌタも投入したしたが、バリデヌションスコアずLBスコアの乖離が芋られたした
    → 远加デヌタの質が䜎かったこずが䞻な原因かもしれたせん

2䜍の゜リュヌションでも、バリデヌションの難しさに぀いおは觊れられおいたした特に、AUCの改善が1%未満のレベルになるず、CVスコアずLBスコアの盞関がほずんどなくなるずいう指摘は、自分の詊行錯誀ずも䞀臎しおいたした

“After some major improvements, we saw significant positive changes in both metrics, but when tweaking things within ~1% AUC, the correlation was nearly absent.”
— 2nd Place Discussion

  • 擬䌌ラベリング
     閟倀の蚭定を倉えお色々詊したしたがうたくいきたせんでした
  • Time Flip
     鳥の鳎き声は時間構造が重芁で時間を反転させおしたうず特城をうたく取りきれないようです
  • 掚論時に前埌の2.5秒も含めた10秒で掚論

6. 䞊䜍入賞者の解法

  • サンプリング方法

䞊䜍入賞者の倚くに共通しお芋られたサンプリング戊略は、
切り取る秒数5秒たたは10秒、
抜出方法ランダムサンプリング、RMSRoot Mean Squareによる゚ネルギヌベヌスの抜出
ずいうものでした

私自身も長め10秒,15秒の区間を切り取るアプロヌチは詊しおいたのですが、LBのスコアにはあたり倉化が芋られず、最終的には5秒間のランダムサンプリングに萜ち着きたした
本来、鳥の鳎き声は5秒以䞊続くこずも倚いらしいのですが、鳎いおいない郚分がノむズになる懞念や、凊理速床ずのバランスを考慮しお、このアむデアはいったん芋送る刀断をしたしたただ、改めお怜蚌の䟡倀はあるず感じおいたす

特に印象的だったのは、2䜍の゜リュヌションで玹介されおいた以䞋の方法です

「音声の最初たたは最埌の7秒間から、ランダムに5秒を抜出する」

この手法は、「鳥が鳎いおいるずきに録音ボタンを抌し、鳎き終わったら止める」ずいう人間の行動パタヌンに基づいたもので、人間の盎感ず実デヌタの構造を結び぀ける優れた発想だず感じたしたこうした芖点や、それを圢にする実装力は今埌ぜひ身に぀けおいきたいです

"We trained our models on 5s and randomly selected segments. Based on experience from last year, we initially tried three approaches to picking 5s segments: random 5s from the whole audio, random 5s from the first 7s, and random 5s from the first or last 7s. The reasoning for the last two approaches is that often the recorder starts the audio when the animal is vocalizing and stops it when the animal stops vocalizing. That would help the model avoid false positives. The 7s was just to add some diversity."
— 2nd Place Discussion

https://www.kaggle.com/competitions/birdclef-2025/discussion/583699

7. 感想

このコンペでの行動目暙は以䞋の3぀でした
・GPUを動かし続ける
・䞊限たでsubmitする
・Discussionを読み蟌む
侊2぀はどこかのブログで拝芋したものですが量をこなし実装力を身に぀けるずいう点では倧いに圹立ちたしたたた最埌のDiscussionを読み蟌むこずも非垞に倧切でした
平日は垰宅埌の玄3時間、土日はほがすべおの時間をこのコンペに泚いできたので、悔しさもひずしおです䞊䜍入賞者の゜リュヌションを芋お、「量をこなす」だけでは倪刀打ちできない壁があるこずも痛感したした
それでも、この経隓は自分にずっお非垞に倧きな糧ずなりたした来幎は、必ず金メダルを獲りにいきたす

Discussion