要約
本論文では、漁業関連データを対象に、クラウドソーシングのインターフェースを活用できる複数の学習ループと生産ループでデータセットを反復することにより、ラベル付き画像データセットに収束させる手法を紹介する。我々は、自律型水中ロボット「Seabed」を用いて収集した2つの画像データセットに対する我々のアルゴリズムとその結果を紹介する。最初のデータセットは、完全にラベル付けされていない2,026枚の画像からなり、2番目のデータセットは、専門家によってポイントアノテーションされた21,968枚の画像から構成される。その結果、小さな部分集合で学習し、それを反復してより大きなラベル付きデータ集合を構築することで、少ない反復回数で完全なアノテーションデータ集合に収束できることがわかった。また、専門家がラベル付けしたデータセットの場合でも、本手法の1回の繰り返しにより、魚に関連するラベルの重なりや非常に小さい例、水中画像のコントラストの制限により不明瞭な例など、さらに複雑なラベルを発見し、ラベルを改善することができました。
要約(オリジナル)
In this paper, we present a methodology for fisheries-related data that allows us to converge on a labeled image dataset by iterating over the dataset with multiple training and production loops that can exploit crowdsourcing interfaces. We present our algorithm and its results on two separate sets of image data collected using the Seabed autonomous underwater vehicle. The first dataset comprises of 2,026 completely unlabeled images, while the second consists of 21,968 images that were point annotated by experts. Our results indicate that training with a small subset and iterating on that to build a larger set of labeled data allows us to converge to a fully annotated dataset with a small number of iterations. Even in the case of a dataset labeled by experts, a single iteration of the methodology improves the labels by discovering additional complicated examples of labels associated with fish that overlap, are very small, or obscured by the contrast limitations associated with underwater imagery.
arxiv情報
著者 | Zhiyong Zhang,Pushyami Kaveti,Hanumant Singh,Abigail Powell,Erica Fruh,M. Elizabeth Clarke |
発行日 | 2022-06-08 06:47:15+00:00 |
arxivサイト | arxiv_id(pdf) |