要約
能動学習は、最小のアノテーションコストで最大の性能を達成するために、データプールからアノテーションのためのサンプルを自動的に選択する。これは、アノテーションにコストがかかるセマンティックセグメンテーションにおいて、特に重要である。本研究では、セマンティックセグメンテーションの文脈で、データ分布が文献で提案されている様々な能動学習の目的の性能に決定的な影響を与えることを示す。特に、ほとんどの運転シナリオやビデオデータセットに見られるような、データの冗長性が大きな役割を果たす。我々は、半教師付き学習と能動学習を統合することで、2つの目的が一致する場合に性能を向上できることを実証する。我々の実験により、運転シーンにおけるセグメンテーションのための現在の能動学習ベンチマークは、既に多様性が最大になるようにキュレーションされたデータで動作するため、現実的でないことが示される。そこで、より現実的な評価スキームを提案する。このスキームでは、アクティブラーニング単体でも、半教師付き学習と組み合わせた場合でも、アクティブラーニングの価値が明確になる。
要約(オリジナル)
Active learning automatically selects samples for annotation from a data pool to achieve maximum performance with minimum annotation cost. This is particularly critical for semantic segmentation, where annotations are costly. In this work, we show in the context of semantic segmentation that the data distribution is decisive for the performance of the various active learning objectives proposed in the literature. Particularly, redundancy in the data, as it appears in most driving scenarios and video datasets, plays a large role. We demonstrate that the integration of semi-supervised learning with active learning can improve performance when the two objectives are aligned. Our experimental study shows that current active learning benchmarks for segmentation in driving scenarios are not realistic since they operate on data that is already curated for maximum diversity. Accordingly, we propose a more realistic evaluation scheme in which the value of active learning becomes clearly visible, both by itself and in combination with semi-supervised learning.
arxiv情報
著者 | Sudhanshu Mittal,Joshua Niemeijer,Jörg P. Schäfer,Thomas Brox |
発行日 | 2023-02-08 14:23:37+00:00 |
arxivサイト | arxiv_id(pdf) |