要約
ディープラーニングを成功させるには、注釈付きの高品質で大量のデータが必要です。
ただし、データの収集とクリーニングには費用と時間がかかるため、実際にはデータセットのサイズと品質はトレードオフになります。
実際のアプリケーション、特にクラウドソーシング データセットを使用するアプリケーションでは、ノイズの多いラベルを除外することが重要です。
これに対処するために、この論文では、高品質データの不一致ランク付けによる自動ノイズラベル検出 (NLD) 技術を提案します。
この手法を概念実証として自動話者検証 (ASV) タスクに適用します。
クラス間およびクラス内の両方の不一致ランキングを調査し、さまざまなノイズ設定の下でいくつかのメトリック学習損失関数を比較します。
実験結果は、提案されたソリューションが大規模な話者認識データセットの効率的かつ効果的なクリーニングを向上させることができることを確認しています。
要約(オリジナル)
The success of deep learning requires high-quality annotated and massive data. However, the size and the quality of a dataset are usually a trade-off in practice, as data collection and cleaning are expensive and time-consuming. In real-world applications, especially those using crowdsourcing datasets, it is important to exclude noisy labels. To address this, this paper proposes an automatic noisy label detection (NLD) technique with inconsistency ranking for high-quality data. We apply this technique to the automatic speaker verification (ASV) task as a proof of concept. We investigate both inter-class and intra-class inconsistency ranking and compare several metric learning loss functions under different noise settings. Experimental results confirm that the proposed solution could increase both the efficient and effective cleaning of large-scale speaker recognition datasets.
arxiv情報
著者 | Ruibin Yuan,Hanzhi Yin,Yi Wang,Yifan He,Yushi Ye,Lei Zhang,Zhizheng Wu |
発行日 | 2023-06-15 14:08:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google