要約
機械学習における最大の課題の 1 つはデータ収集です。
モデルがどのように動作するかを決定するため、トレーニング データは重要な部分です。
オブジェクトの分類では、オブジェクトごとにさまざまな条件で多数の画像をキャプチャすることは、常に可能であるとは限らず、非常に時間と手間がかかる場合があります。
したがって、この作業では、トレーニング データセット内の限られたデータに対処するために、ゲーム エンジンを使用して人工画像を作成する方法を探ります。
実際のデータと合成データを組み合わせてオブジェクト分類エンジンをトレーニングします。この戦略は、分類器による決定の信頼性を高めるのに有益であることが示されています。これは、産業用の設定ではしばしば重要です。
実際のデータと合成データを組み合わせるには、まず大量の合成データで分類器をトレーニングし、次に実際の画像で微調整します。
もう 1 つの重要な結果は、微調整に必要な実際の画像の量がそれほど多くなく、クラスごとにわずか 12 または 24 の画像で最高精度に達することです。
これにより、大量の実際のデータを取得する必要性が大幅に軽減されます。
要約(オリジナル)
One of the biggest challenges in machine learning is data collection. Training data is an important part since it determines how the model will behave. In object classification, capturing a large number of images per object and in different conditions is not always possible and can be very time-consuming and tedious. Accordingly, this work explores the creation of artificial images using a game engine to cope with limited data in the training dataset. We combine real and synthetic data to train the object classification engine, a strategy that has shown to be beneficial to increase confidence in the decisions made by the classifier, which is often critical in industrial setups. To combine real and synthetic data, we first train the classifier on a massive amount of synthetic data, and then we fine-tune it on real images. Another important result is that the amount of real images needed for fine-tuning is not very high, reaching top accuracy with just 12 or 24 images per class. This substantially reduces the requirements of capturing a great amount of real data.
arxiv情報
| 著者 | August Baaz,Yonan Yonan,Kevin Hernandez-Diaz,Fernando Alonso-Fernandez,Felix Nilsson |
| 発行日 | 2022-12-09 11:43:04+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google