Beyond Silence: Bias Analysis through Loss and Asymmetric Approach in Audio Anti-Spoofing


オーディオのスプーフィング検出研究の現在の傾向は、さまざまなスプーフィング アーティファクトを識別する方法を学習することで、目に見えない攻撃全体を一般化するモデルの能力を向上させることに努めています。
この重点は主にスプーフィング クラスに焦点を当てています。
最近、いくつかの研究で、沈黙の分布が 2 つのクラス間で異なり、これが近道として機能する可能性があることが指摘されています。
私たちの調査では、2 つのクラス間のトレーニング ダイナミクスの大きな違いが浮き彫りになり、本物のクラスの堅牢なモデリングに焦点を当てた将来の研究の必要性が強調されています。


Current trends in audio anti-spoofing detection research strive to improve models’ ability to generalize across unseen attacks by learning to identify a variety of spoofing artifacts. This emphasis has primarily focused on the spoof class. Recently, several studies have noted that the distribution of silence differs between the two classes, which can serve as a shortcut. In this paper, we extend class-wise interpretations beyond silence. We employ loss analysis and asymmetric methodologies to move away from traditional attack-focused and result-oriented evaluations towards a deeper examination of model behaviors. Our investigations highlight the significant differences in training dynamics between the two classes, emphasizing the need for future research to focus on robust modeling of the bonafide class.


著者 Hye-jin Shim,Md Sahidullah,Jee-weon Jung,Shinji Watanabe,Tomi Kinnunen
発行日 2024-08-26 14:56:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク