要約
水中音響ターゲット認識(UATR)は、海洋の多様性と国防の安全を保護するために非常に重要です。
深い学習の開発はUATRに新しい機会を提供しますが、参照サンプルの不足と複雑な環境干渉によってもたらされる課題に直面しています。
これらの問題に対処するために、マルチタスクバランスチャネル注意畳み込みコボリューションニューラルネットワーク(MT-BCA-CNN)を提案します。
この方法は、チャネル注意メカニズムをマルチタスク学習戦略と統合し、共有機能抽出器とマルチタスク分類器を構築して、ターゲット分類と機能の再構築タスクを共同で最適化します。
チャネル注意メカニズムは、ノイズを抑制しながら、高調波構造などの識別的な音響的特徴を動的に強化します。
Watkins Marine Lifeデータセットの実験は、MT-BCA-CNNが97 \%分類精度と95 \%$ F1 $スコアを27クラスの少ないショットシナリオで達成することを示しています。
アブレーション研究は、マルチタスク学習と注意メカニズムの相乗的な利点を確認し、動的な重み付け調整戦略はタスクの貢献度を効果的にバランスさせます。
この作業は、少数のショットの水中音響認識の効率的なソリューションを提供し、海洋生物音響学とソナー信号処理の研究を進めます。
要約(オリジナル)
Underwater acoustic target recognition (UATR) is of great significance for the protection of marine diversity and national defense security. The development of deep learning provides new opportunities for UATR, but faces challenges brought by the scarcity of reference samples and complex environmental interference. To address these issues, we proposes a multi-task balanced channel attention convolutional neural network (MT-BCA-CNN). The method integrates a channel attention mechanism with a multi-task learning strategy, constructing a shared feature extractor and multi-task classifiers to jointly optimize target classification and feature reconstruction tasks. The channel attention mechanism dynamically enhances discriminative acoustic features such as harmonic structures while suppressing noise. Experiments on the Watkins Marine Life Dataset demonstrate that MT-BCA-CNN achieves 97\% classification accuracy and 95\% $F1$-score in 27-class few-shot scenarios, significantly outperforming traditional CNN and ACNN models, as well as popular state-of-the-art UATR methods. Ablation studies confirm the synergistic benefits of multi-task learning and attention mechanisms, while a dynamic weighting adjustment strategy effectively balances task contributions. This work provides an efficient solution for few-shot underwater acoustic recognition, advancing research in marine bioacoustics and sonar signal processing.
arxiv情報
著者 | Wei Huang,Shumeng Sun,Junpeng Lu,Zhenpeng Xu,Zhengyang Xiu,Hao Zhang |
発行日 | 2025-04-17 17:11:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google