BirdSet: A Multi-Task Benchmark for Classification in Avian Bioacoustics


ディープラーニング (DL) モデルは、環境の健全性と生物多様性を診断するための鳥類の生物音響学の強力なツールとして登場しました。
信頼性の高い DL モデルでは、費用対効果の高い受動的音響モニタリング シナリオで生体音響の可能性を最大限に活用するために、さまざまな種や環境にわたって鳥の鳴き声を柔軟に分析する必要があります。
これらの課題を克服するために、鳥類の生物音響学における鳥の鳴き声を分類するための総合的アプローチによる研究努力を統合する統一フレームワークである BirdSet ベンチマークを紹介します。
BirdSet は、オープンソースの鳥の記録を厳選されたデータセット コレクションに統合します。
BirdSet は、現在のモデルのベースライン結果を確立することで、比較を容易にし、その後のデータ収集をガイドし、鳥類の生体音響学への初心者のアクセスしやすさを高めることを目指しています。


Deep learning (DL) models have emerged as a powerful tool in avian bioacoustics to diagnose environmental health and biodiversity. However, inconsistencies in research pose notable challenges hindering progress in this domain. Reliable DL models need to analyze bird calls flexibly across various species and environments to fully harness the potential of bioacoustics in a cost-effective passive acoustic monitoring scenario. Data fragmentation and opacity across studies complicate a comprehensive evaluation of general model performance. To overcome these challenges, we present the BirdSet benchmark, a unified framework consolidating research efforts with a holistic approach for classifying bird vocalizations in avian bioacoustics. BirdSet harmonizes open-source bird recordings into a curated dataset collection. This unified approach provides an in-depth understanding of model performance and identifies potential shortcomings across different tasks. By establishing baseline results of current models, BirdSet aims to facilitate comparability, guide subsequent data collection, and increase accessibility for newcomers to avian bioacoustics.


著者 Lukas Rauch,Raphael Schwinger,Moritz Wirth,René Heinrich,Jonas Lange,Stefan Kahl,Bernhard Sick,Sven Tomforde,Christoph Scholz
発行日 2024-03-15 15:10:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク