要約
ディープラーニング (DL) モデルは、環境の健全性と生物多様性を診断するための鳥類の生物音響学の強力なツールとして登場しました。
しかし、研究における矛盾は、この分野の進歩を妨げる顕著な課題を引き起こしています。
信頼性の高い DL モデルでは、費用対効果の高い受動的音響モニタリング シナリオで生体音響の可能性を最大限に活用するために、さまざまな種や環境にわたって鳥の鳴き声を柔軟に分析する必要があります。
研究全体にわたるデータの断片化と不透明さにより、一般的なモデルのパフォーマンスの包括的な評価が複雑になります。
これらの課題を克服するために、鳥類の生物音響学における鳥の鳴き声を分類するための総合的アプローチによる研究努力を統合する統一フレームワークである BirdSet ベンチマークを紹介します。
BirdSet は、オープンソースの鳥の記録を厳選されたデータセット コレクションに統合します。
この統合されたアプローチにより、モデルのパフォーマンスを深く理解し、さまざまなタスクにわたる潜在的な欠点を特定できます。
BirdSet は、現在のモデルのベースライン結果を確立することで、比較を容易にし、その後のデータ収集をガイドし、鳥類の生体音響学への初心者のアクセスしやすさを高めることを目指しています。
要約(オリジナル)
Deep learning (DL) models have emerged as a powerful tool in avian bioacoustics to diagnose environmental health and biodiversity. However, inconsistencies in research pose notable challenges hindering progress in this domain. Reliable DL models need to analyze bird calls flexibly across various species and environments to fully harness the potential of bioacoustics in a cost-effective passive acoustic monitoring scenario. Data fragmentation and opacity across studies complicate a comprehensive evaluation of general model performance. To overcome these challenges, we present the BirdSet benchmark, a unified framework consolidating research efforts with a holistic approach for classifying bird vocalizations in avian bioacoustics. BirdSet harmonizes open-source bird recordings into a curated dataset collection. This unified approach provides an in-depth understanding of model performance and identifies potential shortcomings across different tasks. By establishing baseline results of current models, BirdSet aims to facilitate comparability, guide subsequent data collection, and increase accessibility for newcomers to avian bioacoustics.
arxiv情報
著者 | Lukas Rauch,Raphael Schwinger,Moritz Wirth,René Heinrich,Jonas Lange,Stefan Kahl,Bernhard Sick,Sven Tomforde,Christoph Scholz |
発行日 | 2024-03-15 15:10:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google