📢

論文要約: Kaggle コンペ "Freesound Audio Tagging 2019" のベースラインモデル

2022/03/03に公開

論文

Kaggle コンペ "Freesound Audio Tagging 2019"^[1] にて、ホストが用意したベースラインモデル^[2]について説明した論文。

AudioSetと同様の音声マルチタギングのタスク
ラベルが不正確だがサンプル数が多いデータセット(noisy train)とラベルが正確だがサンプル数が少ないデータセット(curated train)の2つが与えられている。それぞれデータソースも異なる。また、評価用ラベルはcrated trainと同じデータソースから作成。
コンペティションのメトリクスにlωlrap("lol wrap"と発音)という予測のランクに基づいた指標が採用されている
カーネルコンペだが、ノートブックの制限時間が1時間と現在よりもかなり短い

private LB=0.546。参考として、1st placeのモデル^[4]がprivate LB=0.75980。

脚注