Towards Reducing Data Acquisition and Labeling for Defect Detection using Simulated Data

要約

多くの製造現場では、機械学習やコンピューター ビジョン用のデータに注釈を付けるにはコストがかかりますが、合成データは大幅に低コストで生成できます。
したがって、現実世界のデータを合成データで置き換えることは、大量のトレーニング データを必要とする多くの機械学習アプリケーションにとって魅力的です。
ただし、合成データのみに依存すると、主に合成データと現実世界のデータの間のドメインのシフトにより、現実世界のデータで適切に機能するモデルを効果的にトレーニングするには不十分であることがよくあります。
アルミニウムホイールのX線スキャンで欠陥を検出する際に、このようなドメインシフトに対処するアプローチについて説明します。
シミュレートされた X 線画像と現実世界の X 線画像の両方を使用して、さまざまな戦略で物体検出モデルをトレーニングし、注釈付きの実世界のトレーニング サンプルの需要を最小限に抑えながら、最良の検出結果を生成するトレーニング アプローチを特定します。
私たちの予備的な調査結果は、利用可能なアノテーション付きサンプルの総数が固定されている場合、sim-2-real ドメイン適応アプローチは完全に監視されたオラクルよりもコスト効率が高いことを示唆しています。
一定数のラベル付き実世界サンプルを考慮すると、合成データとラベルなし実世界データを組み合わせたトレーニングにより、大幅に低いコストで同等またはそれ以上の検出結果が得られました。
私たちは、さまざまなトレーニング戦略の費用効率に関する今後の研究が、応用機械学習プロジェクトにおける予算の割り当て方法をより深く理解するために重要であると主張します。

要約(オリジナル)

In many manufacturing settings, annotating data for machine learning and computer vision is costly, but synthetic data can be generated at significantly lower cost. Substituting the real-world data with synthetic data is therefore appealing for many machine learning applications that require large amounts of training data. However, relying solely on synthetic data is frequently inadequate for effectively training models that perform well on real-world data, primarily due to domain shifts between the synthetic and real-world data. We discuss approaches for dealing with such a domain shift when detecting defects in X-ray scans of aluminium wheels. Using both simulated and real-world X-ray images, we train an object detection model with different strategies to identify the training approach that generates the best detection results while minimising the demand for annotated real-world training samples. Our preliminary findings suggest that the sim-2-real domain adaptation approach is more cost-efficient than a fully supervised oracle – if the total number of available annotated samples is fixed. Given a certain number of labeled real-world samples, training on a mix of synthetic and unlabeled real-world data achieved comparable or even better detection results at significantly lower cost. We argue that future research into the cost-efficiency of different training strategies is important for a better understanding of how to allocate budget in applied machine learning projects.

arxiv情報

著者 Lukas Malte Kemeter,Rasmus Hvingelby,Paulina Sierak,Tobias Schön,Bishwajit Gosswam
発行日 2024-06-27 13:51:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク