An Automated Pipeline for Few-Shot Bird Call Classification: A Case Study with the Tooth-Billed Pigeon

要約

本論文では、BirdNETやPerchのような大規模な公開分類器にはない希少種のために設計された、自動ワンショット鳥類鳴き声分類パイプラインを紹介する。これらのモデルは、豊富な学習データを持つ一般的な鳥類の検出には優れているが、既知の記録が1~3件しかない種の検出には適していない。この問題に対処するため、我々は大規模な鳥類分類ネットワークの埋め込み空間を活用し、フィルタリングとノイズ除去の前処理技術と組み合わせた余弦類似度を使用する分類器を開発し、最小限の訓練データで検出を最適化する。クラスタリングメトリクスを用いて様々な埋め込み空間を評価し、ゼノカントの記録を用いたシミュレーションシナリオと、既存の分類器がなく、3つの記録しか確認されていない、絶滅の危機に瀕している歯が生えたハト(Didunculus strigirostris)を用いた実環境テストの両方で、本アプローチを検証する。最終的なモデルは、ハトの鳴き声の検出において1.0の再現率と0.95の精度を達成し、フィールドでの使用に実用的なものとなった。このオープンソースのシステムは、絶滅の危機に瀕している希少種を検出・監視しようとする自然保護活動家に実用的なツールを提供する。

要約(オリジナル)

This paper presents an automated one-shot bird call classification pipeline designed for rare species absent from large publicly available classifiers like BirdNET and Perch. While these models excel at detecting common birds with abundant training data, they lack options for species with only 1-3 known recordings-a critical limitation for conservationists monitoring the last remaining individuals of endangered birds. To address this, we leverage the embedding space of large bird classification networks and develop a classifier using cosine similarity, combined with filtering and denoising preprocessing techniques, to optimize detection with minimal training data. We evaluate various embedding spaces using clustering metrics and validate our approach in both a simulated scenario with Xeno-Canto recordings and a real-world test on the critically endangered tooth-billed pigeon (Didunculus strigirostris), which has no existing classifiers and only three confirmed recordings. The final model achieved 1.0 recall and 0.95 accuracy in detecting tooth-billed pigeon calls, making it practical for use in the field. This open-source system provides a practical tool for conservationists seeking to detect and monitor rare species on the brink of extinction.

arxiv情報

著者 Abhishek Jana,Moeumu Uili,James Atherton,Mark O’Brien,Joe Wood,Leandra Brickson
発行日 2025-05-02 17:04:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD パーマリンク