Mixture of Mixups for Multi-label Classification of Rare Anuran Sounds

要約

マルチラベルの不均衡な分類は、機械学習において重大な課題を引き起こします。特に、動物の鳴き声が頻繁に共鳴し、特定の音の頻度が他の音よりはるかに少ない生物音響学では顕著です。
この論文では、クラスの不均衡とマルチラベルの例の両方を含むデータセット AnuraSet を使用して無尾類の音声を分類する特定のケースに焦点を当てます。
これらの課題に対処するために、混合正則化手法である Mixup、Manifold Mixup、および MultiMix を活用するフレームワークである Mixture of Mixups (Mix2) を導入します。
実験結果は、これらの方法が個別に次善の結果をもたらす可能性があることを示しています。
ただし、トレーニングの反復ごとに 1 つを選択してランダムに適用すると、特に発生頻度が少ない稀なクラスの場合、前述の課題に対処するのに効果的であることがわかります。
さらに分析を進めると、Mix2 はクラスの共起のさまざまなレベルにわたってサウンドを分類するのにも熟練していることが明らかになりました。

要約(オリジナル)

Multi-label imbalanced classification poses a significant challenge in machine learning, particularly evident in bioacoustics where animal sounds often co-occur, and certain sounds are much less frequent than others. This paper focuses on the specific case of classifying anuran species sounds using the dataset AnuraSet, that contains both class imbalance and multi-label examples. To address these challenges, we introduce Mixture of Mixups (Mix2), a framework that leverages mixing regularization methods Mixup, Manifold Mixup, and MultiMix. Experimental results show that these methods, individually, may lead to suboptimal results; however, when applied randomly, with one selected at each training iteration, they prove effective in addressing the mentioned challenges, particularly for rare classes with few occurrences. Further analysis reveals that Mix2 is also proficient in classifying sounds across various levels of class co-occurrences.

arxiv情報

著者 Ilyass Moummad,Nicolas Farrugia,Romain Serizel,Jeremy Froidevaux,Vincent Lostanlen
発行日 2024-03-14 17:39:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SD, eess.AS パーマリンク