要約
データ飢餓とデータの不均衡は、多くの深層学習アプローチにおける 2 つの大きな落とし穴です。
たとえば、高度に最適化された生産ラインでは、欠陥のあるサンプルはほとんど取得されませんが、欠陥のないサンプルはほとんど無料で提供されます。
ただし、欠陥は互いに似ているように見えることがよくあります。たとえば、異なる製品の傷はいくつかの特徴だけが異なる場合があります。
この作業では、フレームワークである Defect Transfer GAN (DT-GAN) を紹介します。これは、さまざまなバックグラウンド製品とは無関係に、またさまざまなバックグラウンド製品間で欠陥タイプを表すことを学習し、欠陥固有のスタイルを適用して現実的な欠陥画像を生成できます。
MVTec AD と 2 つの追加データセットに関する実証研究では、DT-GAN が最先端の画像合成方法よりも優れていることを示しています。
欠陥生成におけるサンプルの忠実度と多様性。
さらに、製造における重要なダウンストリーム タスクである欠陥分類の利点を示します。
結果は、DT-GAN からの拡張データが少数のサンプル体制でも一貫したゲインを提供し、従来のデータ拡張方法と高度なデータ拡張方法の両方と比較してエラー率を最大 51% 削減することを示しています。
要約(オリジナル)
Data-hunger and data-imbalance are two major pitfalls in many deep learning approaches. For example, on highly optimized production lines, defective samples are hardly acquired while non-defective samples come almost for free. The defects however often seem to resemble each other, e.g., scratches on different products may only differ in a few characteristics. In this work, we introduce a framework, Defect Transfer GAN (DT-GAN), which learns to represent defect types independent of and across various background products and yet can apply defect-specific styles to generate realistic defective images. An empirical study on the MVTec AD and two additional datasets showcase DT-GAN outperforms state-of-the-art image synthesis methods w.r.t. sample fidelity and diversity in defect generation. We further demonstrate benefits for a critical downstream task in manufacturing — defect classification. Results show that the augmented data from DT-GAN provides consistent gains even in the few samples regime and reduces the error rate up to 51% compared to both traditional and advanced data augmentation methods.
arxiv情報
著者 | Ruyu Wang,Sabrina Hoppe,Eduardo Monari,Marco F. Huber |
発行日 | 2023-02-16 15:35:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google