BirdSet: A Dataset and Benchmark for Classification in Avian Bioacoustics

要約

ディープラーニング (DL) モデルは、環境の健全性を評価するための鳥類の生物音響学の強力なツールとして登場しました。
費用対効果が高く、侵襲性が最小限の受動音響モニタリング (PAM) の可能性を最大限に引き出すには、DL モデルは幅広い種や環境条件にわたる鳥の鳴き声を分析する必要があります。
ただし、データの断片化により、汎化パフォーマンスの包括的な評価が困難になります。
したがって、トレーニング用の約 520,000 羽の世界の鳥の記録とテスト用の 400 時間以上の PAM 記録で構成される BirdSet データセットを導入します。
当社のベンチマークは、包括的なトレーニングおよび評価プロトコルを含むコード実装とともに、比較可能性を高め、研究全体の研究を統合するために、いくつかの DL モデルのベースラインを提供します。

要約(オリジナル)

Deep learning (DL) models have emerged as a powerful tool in avian bioacoustics to assess environmental health. To maximize the potential of cost-effective and minimal-invasive passive acoustic monitoring (PAM), DL models must analyze bird vocalizations across a wide range of species and environmental conditions. However, data fragmentation challenges a comprehensive evaluation of generalization performance. Therefore, we introduce the BirdSet dataset, comprising approximately 520,000 global bird recordings for training and over 400 hours of PAM recordings for testing. Our benchmark offers baselines for several DL models to enhance comparability and consolidate research across studies, along with code implementations that include comprehensive training and evaluation protocols.

arxiv情報

著者 Lukas Rauch,Raphael Schwinger,Moritz Wirth,René Heinrich,Denis Huseljic,Jonas Lange,Stefan Kahl,Bernhard Sick,Sven Tomforde,Christoph Scholz
発行日 2024-06-17 15:25:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク