ContextMix: A context-aware data augmentation method for industrial visual inspection systems

要約

ディープ ニューラル ネットワークが目覚ましいパフォーマンスを達成する一方で、データ拡張は過学習を軽減し、ネットワーク パフォーマンスを向上させるための重要な戦略として浮上しています。
これらの技術は、工業生産の状況において特に重要です。
最近、画像混合ベースの手法が導入され、公開ベンチマーク データセットでのパフォーマンスの向上が示されました。
しかし、産業上の課題への応用は依然として困難です。
製造環境では毎日大量のラベルなしデータが生成されますが、異常なデータが発生する例はわずかです。
これにより、深刻なデータの不均衡が生じます。
したがって、ラベル付けに関連するコストが高いため、バランスのとれたデータセットを作成するのは簡単ではありません。
それにもかかわらず、これは生産性を向上させるための重要なステップです。
このため、産業用アプリケーションとベンチマーク データセットに合わせた手法である ContextMix を紹介します。
ContextMix は、画像全体のサイズを変更し、バッチ内の他の画像に統合することにより、新しいデータを生成します。
このアプローチにより、私たちの方法は、サイズ変更された画像からのさまざまなサイズに基づいて識別特徴を学習し、遮蔽された画像を使用してオブジェクト認識のための有益な二次特徴をトレーニングすることができます。
ContextMix は、画像のサイズ変更に伴う追加の計算コストを最小限に抑えることで、既存の拡張技術と比較してパフォーマンスを向上させます。
公開ベンチマーク データセット上のさまざまなネットワーク アーキテクチャを使用して、分類、検出、セグメンテーションのタスク全体でその有効性を評価します。
私たちが提案した方法は、さまざまな堅牢性タスクにわたって結果が改善されたことを示しています。
受動部品データセットを使用して実証されたように、実際の産業環境におけるその有効性は特に注目に値します。

要約(オリジナル)

While deep neural networks have achieved remarkable performance, data augmentation has emerged as a crucial strategy to mitigate overfitting and enhance network performance. These techniques hold particular significance in industrial manufacturing contexts. Recently, image mixing-based methods have been introduced, exhibiting improved performance on public benchmark datasets. However, their application to industrial tasks remains challenging. The manufacturing environment generates massive amounts of unlabeled data on a daily basis, with only a few instances of abnormal data occurrences. This leads to severe data imbalance. Thus, creating well-balanced datasets is not straightforward due to the high costs associated with labeling. Nonetheless, this is a crucial step for enhancing productivity. For this reason, we introduce ContextMix, a method tailored for industrial applications and benchmark datasets. ContextMix generates novel data by resizing entire images and integrating them into other images within the batch. This approach enables our method to learn discriminative features based on varying sizes from resized images and train informative secondary features for object recognition using occluded images. With the minimal additional computation cost of image resizing, ContextMix enhances performance compared to existing augmentation techniques. We evaluate its effectiveness across classification, detection, and segmentation tasks using various network architectures on public benchmark datasets. Our proposed method demonstrates improved results across a range of robustness tasks. Its efficacy in real industrial environments is particularly noteworthy, as demonstrated using the passive component dataset.

arxiv情報

著者 Hyungmin Kim,Donghun Kim,Pyunghwan Ahn,Sungho Suh,Hansang Cho,Junmo Kim
発行日 2024-01-18 15:15:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク