ALWOD: Active Learning for Weakly-Supervised Object Detection

要約

重要な視覚タスクである物体検出 (OD) は、正確な物体位置特定ラベルを備えた大規模なトレーニング データセットが不足しているという課題が依然として残っています。
この研究では、アクティブ ラーニング (AL) と弱教師ありおよび半教師ありの物体検出パラダイムを融合することで、この問題に対処する新しいフレームワークである ALWOD を提案します。
AL のパフォーマンスはモデルの初期化に大きく依存するため、AL のウォーム スタートとして、非常に小さなラベル付きセットを、弱くタグ付けされた大規模な画像セットと組み合わせて利用する、新しい補助画像生成戦略を提案します。
次に、AL 成功のもう 1 つの重要な要素である新しい AL 取得関数を提案します。これは、学生と教師の OD ペアの不一致と不確実性を利用して、注釈を付けるための最も有益な画像を効果的に提案します。
最後に、AL ループを完了するために、モデルが提案した検出の選択と修正に基づいて、人間のアノテーターに委任された新しいラベル付けタスクを導入します。これは、有益な画像のラベル付けにおいて迅速かつ効果的です。
私たちは、いくつかの困難なベンチマークにわたって、ALWOD が、少数の部分的にラベル付けされているが戦略的に選択された画像インスタンスでトレーニングされた OD と、完全にラベル付けされたデータに依存する OD との間のギャップを大幅に狭めることを実証しました。
私たちのコードは https://github.com/seqam-lab/ALWOD で公開されています。

要約(オリジナル)

Object detection (OD), a crucial vision task, remains challenged by the lack of large training datasets with precise object localization labels. In this work, we propose ALWOD, a new framework that addresses this problem by fusing active learning (AL) with weakly and semi-supervised object detection paradigms. Because the performance of AL critically depends on the model initialization, we propose a new auxiliary image generator strategy that utilizes an extremely small labeled set, coupled with a large weakly tagged set of images, as a warm-start for AL. We then propose a new AL acquisition function, another critical factor in AL success, that leverages the student-teacher OD pair disagreement and uncertainty to effectively propose the most informative images to annotate. Finally, to complete the AL loop, we introduce a new labeling task delegated to human annotators, based on selection and correction of model-proposed detections, which is both rapid and effective in labeling the informative images. We demonstrate, across several challenging benchmarks, that ALWOD significantly narrows the gap between the ODs trained on few partially labeled but strategically selected image instances and those that rely on the fully-labeled data. Our code is publicly available on https://github.com/seqam-lab/ALWOD.

arxiv情報

著者 Yuting Wang,Velibor Ilic,Jiatong Li,Branislav Kisacanin,Vladimir Pavlovic
発行日 2023-09-14 17:59:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク