Addressing Feature Imbalance in Sound Source Separation

要約

ニューラル ネットワークは、タスクを解決するために特定の機能に過度に依存し、無視された機能がタスクに不可欠であるにもかかわらず、他の機能を無視する傾向があるという機能優先の問題に悩まされることがよくあります。
特徴の好みの問題は、主に分類タスクで調査されてきました。
ただし、特徴の好みは高次元回帰タスク、特にソース分離で発生することが観察されます。
ソース分離における特徴の優先度を緩和するために、簡単な特徴を抑制することによる FEAture BAlancing (FEABASE) を提案します。
このアプローチにより、無視されている特徴に関する隠れた情報を学習することで、効率的なデータ活用が可能になります。
空間特徴と音色特徴の間の特徴の好みが現れるマルチチャネル音源分離タスクでこの方法を評価します。

要約(オリジナル)

Neural networks often suffer from a feature preference problem, where they tend to overly rely on specific features to solve a task while disregarding other features, even if those neglected features are essential for the task. Feature preference problems have primarily been investigated in classification task. However, we observe that feature preference occurs in high-dimensional regression task, specifically, source separation. To mitigate feature preference in source separation, we propose FEAture BAlancing by Suppressing Easy feature (FEABASE). This approach enables efficient data utilization by learning hidden information about the neglected feature. We evaluate our method in a multi-channel source separation task, where feature preference between spatial feature and timbre feature appears.

arxiv情報

著者 Jaechang Kim,Jeongyeon Hwang,Soheun Yi,Jaewoong Cho,Jungseul Ok
発行日 2023-09-11 08:11:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク