Beyond Silence: Bias Analysis through Loss and Asymmetric Approach in Audio Anti-Spoofing

要約

オーディオのスプーフィング検出研究の現在の傾向は、さまざまなスプーフィング アーティファクトを識別する方法を学習することで、目に見えない攻撃全体を一般化するモデルの能力を向上させることに努めています。
この重点は主にスプーフィング クラスに焦点を当てています。
最近、いくつかの研究で、沈黙の分布が 2 つのクラス間で異なり、これが近道として機能する可能性があることが指摘されています。
この論文では、沈黙を超えてクラスごとの解釈を拡張します。
当社では、損失分析と非対称手法を採用して、従来の攻撃重視および結果重視の評価から離れ、モデルの動作をより深く調査することに移行しています。
私たちの調査では、2 つのクラス間のトレーニング ダイナミクスの大きな違いが浮き彫りになり、本物のクラスの堅牢なモデリングに焦点を当てた将来の研究の必要性が強調されています。

要約(オリジナル)

Current trends in audio anti-spoofing detection research strive to improve models’ ability to generalize across unseen attacks by learning to identify a variety of spoofing artifacts. This emphasis has primarily focused on the spoof class. Recently, several studies have noted that the distribution of silence differs between the two classes, which can serve as a shortcut. In this paper, we extend class-wise interpretations beyond silence. We employ loss analysis and asymmetric methodologies to move away from traditional attack-focused and result-oriented evaluations towards a deeper examination of model behaviors. Our investigations highlight the significant differences in training dynamics between the two classes, emphasizing the need for future research to focus on robust modeling of the bonafide class.

arxiv情報

著者 Hye-jin Shim,Md Sahidullah,Jee-weon Jung,Shinji Watanabe,Tomi Kinnunen
発行日 2024-08-26 14:56:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク