要約
パッシブ音響モニタリングは、生物多様性の保全のための重要なツールですが、監視されていないオーディオの大量は、意味のある情報を抽出するための現在の主要な課題を生み出します。
ディープラーニングは有望なソリューションを提供します。
広く使用されている鳥の識別モデルであるBirdnetは、多くの研究システムで成功を示していますが、トレーニングデータのバイアスのためにローカルスケールで制限されています。これは、サウンドスケープ全体ではなく特定の場所とターゲットサウンドに焦点を当てています。
鳥種の識別における重要な課題は、多くの記録が標的種を欠いているか、重複する発声を含んでおり、自動識別を複雑にすることです。
これらの問題に対処するために、高保全の懸念のある湿地であるDo \ 〜Nana国立公園(SWスペイン)で、自動鳥の発声識別のためのマルチステージパイプラインを開発しました。
9つの場所に3つの主要な生息地にオーディオモットレコーダーを展開し、461分のオーディオに手動で注釈を付け、349のラベル付きセグメントを34クラスに渡りました。
最初に、スペクトログラムベースの画像処理を使用して鳥の発声を分離するために鳥の歌検出器を適用しました。
その後、種は、ローカルスケールでトレーニングされたカスタムモデルを使用して分類されました。
分類前に鳥の歌検出器を適用すると、種の識別が改善されました。鳥が検出されたセグメントのみを分析するときにすべてのモデルのパフォーマンスが向上したためです。
具体的には、検出器と微調整されたバードネットの組み合わせは、検出せずにベースラインよりも優れていました。
このアプローチは、鳥の歌検出器をローカル分類モデルと統合することの有効性を示しています。
これらの調査結果は、汎用ツールを特定の生態学的課題に適応させる必要性を強調しています。
環境の変化に対する鳥の感受性を考慮して、鳥種を自動的に検出すると、この脅迫された生態系の健康を追跡し、生物多様性の損失を減らすための保全計画をサポートします。
要約(オリジナル)
Passive Acoustic Monitoring is a key tool for biodiversity conservation, but the large volumes of unsupervised audio it generates present major challenges for extracting meaningful information. Deep Learning offers promising solutions. BirdNET, a widely used bird identification model, has shown success in many study systems but is limited at local scale due to biases in its training data, which focus on specific locations and target sounds rather than entire soundscapes. A key challenge in bird species identification is that many recordings either lack target species or contain overlapping vocalizations, complicating automatic identification. To address these problems, we developed a multi-stage pipeline for automatic bird vocalization identification in Do\~nana National Park (SW Spain), a wetland of high conservation concern. We deployed AudioMoth recorders in three main habitats across nine locations and manually annotated 461 minutes of audio, resulting in 3749 labeled segments spanning 34 classes. We first applied a Bird Song Detector to isolate bird vocalizations using spectrogram-based image processing. Then, species were classified using custom models trained at the local scale. Applying the Bird Song Detector before classification improved species identification, as all models performed better when analyzing only the segments where birds were detected. Specifically, the combination of detector and fine-tuned BirdNET outperformed the baseline without detection. This approach demonstrates the effectiveness of integrating a Bird Song Detector with local classification models. These findings highlight the need to adapt general-purpose tools to specific ecological challenges. Automatically detecting bird species helps track the health of this threatened ecosystem, given birds sensitivity to environmental change, and supports conservation planning to reduce biodiversity loss.
arxiv情報
著者 | Alba Márquez-Rodríguez,Miguel Ángel Mohedano-Munoz,Manuel J. Marín-Jiménez,Eduardo Santamaría-García,Giulia Bastianelli,Pedro Jordano,Irene Mendoza |
発行日 | 2025-06-18 12:27:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google