Deep Active Audio Feature Learning in Resource-Constrained Environments

要約

ラベル付きデータが不足しているため、生体音響アプリケーションでのディープ ニューラル ネットワーク (DNN) モデルのトレーニングが困難になっています。
一般的な生体音響アプリケーションでは、必要な量のデータを手動でラベル付けすると、法外なコストがかかる可能性があります。
新しいクラスと現在のクラスの両方を効果的に識別するには、DNN モデルは適度な量の新しいデータから新しい機能を学習し続ける必要があります。
アクティブ ラーニング (AL) は、ラベル付けの労力をほとんど必要とせずに、この学習に役立つアプローチです。
それにもかかわらず、固定特徴抽出アプローチを使用すると、特徴の品質が制限され、結果として AL の利点が十分に活用されなくなります。
特徴抽出を AL ループに組み込み、手動アノテーションの各ラウンド後に特徴抽出を改良することで、この問題に対処する AL フレームワークについて説明します。
さらに、スペクトログラムではなく生のオーディオ処理を使用します。これは新しいアプローチです。
実験の結果、提案された AL フレームワークでは、大規模な DNN モデルの場合、ベンチマーク オーディオ データセット ESC-50、UrbanSound8k、InsectWingBeat で必要なラベル付け作業がそれぞれ 14.3%、66.7%、47.4% 削減され、マイクロコントローラーベースの対応物でも同様の節約が可能であることが明らかになりました。
さらに、保全生物学プロジェクトからのデータを組み込むことによって、私たちの研究の実際的な関連性を示します。
すべてのコードは GitHub で公開されています。

要約(オリジナル)

The scarcity of labelled data makes training Deep Neural Network (DNN) models in bioacoustic applications challenging. In typical bioacoustics applications, manually labelling the required amount of data can be prohibitively expensive. To effectively identify both new and current classes, DNN models must continue to learn new features from a modest amount of fresh data. Active Learning (AL) is an approach that can help with this learning while requiring little labelling effort. Nevertheless, the use of fixed feature extraction approaches limits feature quality, resulting in underutilization of the benefits of AL. We describe an AL framework that addresses this issue by incorporating feature extraction into the AL loop and refining the feature extractor after each round of manual annotation. In addition, we use raw audio processing rather than spectrograms, which is a novel approach. Experiments reveal that the proposed AL framework requires 14.3%, 66.7%, and 47.4% less labelling effort on benchmark audio datasets ESC-50, UrbanSound8k, and InsectWingBeat, respectively, for a large DNN model and similar savings on a microcontroller-based counterpart. Furthermore, we showcase the practical relevance of our study by incorporating data from conservation biology projects. All codes are publicly available on GitHub.

arxiv情報

著者 Md Mohaimenuzzaman,Christoph Bergmeir,Bernd Meyer
発行日 2024-07-01 03:17:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.SD, eess.AS パーマリンク