Few-shot bioacoustic event detection at the DCASE 2023 challenge

要約

フューショット生体音響イベント検出では、対象クラスの少数の例のみにアクセスしながら、さまざまなサウンドスケープで指定されたタイプのサウンド イベントを検出します。
このタスクは、今年 3 回目の DCASE チャレンジの一部として実行され、評価セットは新しい動物種を含むように拡張され、アンサンブル モデルは許可されなくなったという新しいルールが追加されました。
2023 年の少数ショット タスクには 6 つの異なるチームから提出があり、F スコアは評価セットで 63% に達しました。
ここでは、例年と異なる要素を中心にタスクについて説明します。
また、過去の版を振り返り、タスクがどのように進化したかを説明します。
F スコアの結果が着実に改善されている (40%、60%、63%) だけでなく、提案されているシステムの種類もより複雑になっています。
音声イベント検出システムは、提供されるベースラインの単純なバリエーションではなくなりました。複数の少数ショット学習方法論が依然としてこのタスクの強力な候補です。

要約(オリジナル)

Few-shot bioacoustic event detection consists in detecting sound events of specified types, in varying soundscapes, while having access to only a few examples of the class of interest. This task ran as part of the DCASE challenge for the third time this year with an evaluation set expanded to include new animal species, and a new rule: ensemble models were no longer allowed. The 2023 few shot task received submissions from 6 different teams with F-scores reaching as high as 63% on the evaluation set. Here we describe the task, focusing on describing the elements that differed from previous years. We also take a look back at past editions to describe how the task has evolved. Not only have the F-score results steadily improved (40% to 60% to 63%), but the type of systems proposed have also become more complex. Sound event detection systems are no longer simple variations of the baselines provided: multiple few-shot learning methodologies are still strong contenders for the task.

arxiv情報

著者 Ines Nolasco,Burooj Ghani,Shubhr Singh,Ester Vidaña-Vila,Helen Whitehead,Emily Grout,Michael Emmerson,Frants Jensen,Ivan Kiskin,Joe Morford,Ariana Strandburg-Peshkin,Lisa Gill,Hanna Pamuła,Vincent Lostanlen,Dan Stowell
発行日 2023-06-15 15:59:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SD, eess.AS パーマリンク