要約
近年、ディープ ニューラル ネットワーク (DNN) はコンピューター ビジョン タスクにおいて目覚ましい成果を上げており、DNN の成功はデータの豊富さに大きく左右されることがよくあります。
しかし、データや高品質なグラウンドトゥルースの取得には多大な労力と費用がかかります。
データ アノテーションの長く退屈なプロセスでは、アノテーターは間違いを犯しやすく、その結果、画像のラベルが間違ってしまう、つまりノイズの多いラベルが作成されてしまいます。
騒がしいレーベルの出現は避けられない。
さらに、DNN はノイズの多いラベルを簡単に適合できることが研究で示されているため、ノイズの多いラベルの存在はモデルのトレーニング プロセスに重大な損害を引き起こす可能性があります。
したがって、コンピューター ビジョン タスク、特に分類タスクでは、ノイズの多いラベルに対処することが重要です。
この調査では、まず、画像分類タスクにおけるノイズの多いラベルと戦うためのさまざまな深層学習アプローチの進化を包括的にレビューします。
さらに、堅牢なアルゴリズムを設計するために提案されているさまざまなノイズ パターンもレビューします。
さらに、実世界のラベル ノイズの内部パターンを調査し、実世界のデータに基づいて合成ラベル ノイズ パターンを生成するアルゴリズムを提案します。
有名な実世界のデータセット CIFAR-10N でアルゴリズムをテストして、新しい実世界のデータに基づく合成ベンチマークを形成し、ベンチマークでいくつかの典型的なノイズ耐性の手法を評価します。
要約(オリジナル)
In recent years, deep neural networks (DNNs) have gained remarkable achievement in computer vision tasks, and the success of DNNs often depends greatly on the richness of data. However, the acquisition process of data and high-quality ground truth requires a lot of manpower and money. In the long, tedious process of data annotation, annotators are prone to make mistakes, resulting in incorrect labels of images, i.e., noisy labels. The emergence of noisy labels is inevitable. Moreover, since research shows that DNNs can easily fit noisy labels, the existence of noisy labels will cause significant damage to the model training process. Therefore, it is crucial to combat noisy labels for computer vision tasks, especially for classification tasks. In this survey, we first comprehensively review the evolution of different deep learning approaches for noisy label combating in the image classification task. In addition, we also review different noise patterns that have been proposed to design robust algorithms. Furthermore, we explore the inner pattern of real-world label noise and propose an algorithm to generate a synthetic label noise pattern guided by real-world data. We test the algorithm on the well-known real-world dataset CIFAR-10N to form a new real-world data-guided synthetic benchmark and evaluate some typical noise-robust methods on the benchmark.
arxiv情報
著者 | Mengting Li,Chuang Zhu |
発行日 | 2024-04-05 15:11:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google