Automatic Bat Call Classification using Transformer Networks

要約

コウモリのエコーロケーション鳴き声からコウモリの種を自動的に識別することは、難しいですが、コウモリとコウモリが生息する生態系を監視する上で重要な作業です。コウモリの鳴き声の自動識別における主な課題は、鳴き声のばらつきの多さ、種間の類似性、干渉する鳴き声、および注釈付きデータの欠如です。
現在利用可能なモデルの多くは、単一呼び出しのデータセットでトレーニングされているため、実際のデータでは比較的パフォーマンスが悪く、さらに、リアルタイムの分類には遅すぎることがよくあります。
ここでは、リアルタイム分類シナリオでの潜在的なアプリケーションを備えたマルチラベル分類のための Transformer アーキテクチャを提案します。
複数のコウモリの鳴き声を複数の同時鳴き声を含む単一の録音にマージすることで、合成的に生成された複数種の録音に基づいてモデルをトレーニングします。
私たちのアプローチは、テストセットで単一種の精度 88.92% (F1 スコア 84.23%) と複数種のマクロ F1 スコア 74.40% を達成しました。
独立した公開データセット ChiroVox 上の他の 3 つのツールと比較して、私たちのモデルは、単一種の分類では少なくとも 25.82% 高い精度を達成し、複数種の分類では少なくとも 6.9% 優れたマクロ F1 スコアを達成しています。

要約(オリジナル)

Automatically identifying bat species from their echolocation calls is a difficult but important task for monitoring bats and the ecosystem they live in. Major challenges in automatic bat call identification are high call variability, similarities between species, interfering calls and lack of annotated data. Many currently available models suffer from relatively poor performance on real-life data due to being trained on single call datasets and, moreover, are often too slow for real-time classification. Here, we propose a Transformer architecture for multi-label classification with potential applications in real-time classification scenarios. We train our model on synthetically generated multi-species recordings by merging multiple bats calls into a single recording with multiple simultaneous calls. Our approach achieves a single species accuracy of 88.92% (F1-score of 84.23%) and a multi species macro F1-score of 74.40% on our test set. In comparison to three other tools on the independent and publicly available dataset ChiroVox, our model achieves at least 25.82% better accuracy for single species classification and at least 6.9% better macro F1-score for multi species classification.

arxiv情報

著者 Frank Fundel,Daniel A. Braun,Sebastian Gottwald
発行日 2023-09-20 11:15:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.SD, eess.AS パーマリンク