要約
コンピューター ビジョン用の大規模なサンプル データセットにラベルを付けるという課題は、画像リポジトリの可用性と範囲を制限し続けています。
この研究は、頭上の衛星画像とオブジェクト検出の場合に、自動化されたデータ収集、キュレーション、ラベル付け、および最小限の人的介入による反復トレーニングのための新しい方法を提供します。
新しい運用規模は、グリッド検索で都市全体 (68 平方マイル) を効果的にスキャンし、宇宙観測から車の色を予測しました。
部分的にトレーニングされた yolov5 モデルは、反復サイクルでさらに洗練されたモデル予測を出力するための初期推論シードとして機能しました。
ここでのソフト ラベリングとは、オーバーフィッティングを減らし、以前には見られなかったテスト データに対する一般化された予測を強化するために、潜在的に価値のある拡張としてラベル ノイズを受け入れることを指します。
このアプローチは、車のトリミングされた画像がピクセル値のみから白またはカラフルとしてサブタイプ情報を自動的に受け取ることができる現実世界のインスタンスを利用して、人間の労働に過度に依存することなくエンドツーエンドのパイプラインを完成させます。
要約(オリジナル)
The challenge of labeling large example datasets for computer vision continues to limit the availability and scope of image repositories. This research provides a new method for automated data collection, curation, labeling, and iterative training with minimal human intervention for the case of overhead satellite imagery and object detection. The new operational scale effectively scanned an entire city (68 square miles) in grid search and yielded a prediction of car color from space observations. A partially trained yolov5 model served as an initial inference seed to output further, more refined model predictions in iterative cycles. Soft labeling here refers to accepting label noise as a potentially valuable augmentation to reduce overfitting and enhance generalized predictions to previously unseen test data. The approach takes advantage of a real-world instance where a cropped image of a car can automatically receive sub-type information as white or colorful from pixel values alone, thus completing an end-to-end pipeline without overdependence on human labor.
arxiv情報
著者 | Grant Rosario,David Noever,Matt Ciolino |
発行日 | 2023-01-19 16:41:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google