Self-improving object detection via disagreement reconciliation

要約

新しい環境条件がトレーニング データで十分に表現されていない場合、オブジェクト検出器のパフォーマンスが低下することがよくあります。
この論文では、既存のオブジェクト検出器を自動的に微調整しながら、新しい環境で人間の介入に依存せずに、つまり自己監視方式で画像を探索および取得する方法について説明します。
私たちの設定では、エージェントは最初に、事前にトレーニングされた既製の検出器を使用して環境を探索し、オブジェクトを見つけて疑似ラベルを関連付けます。
同じオブジェクトの擬似ラベルが異なるビュー間で一貫している必要があると仮定することにより、観測間のコンセンサスから洗練された予測を生成するための新しいメカニズムを考案します。
私たちのアプローチは、既製のオブジェクト検出器をmAPに関して2.66%改善し、グラウンドトゥルースアノテーションに依存することなく現在の最先端技術を上回ります。

要約(オリジナル)

Object detectors often experience a drop in performance when new environmental conditions are insufficiently represented in the training data. This paper studies how to automatically fine-tune a pre-existing object detector while exploring and acquiring images in a new environment without relying on human intervention, i.e., in a self-supervised fashion. In our setting, an agent initially explores the environment using a pre-trained off-the-shelf detector to locate objects and associate pseudo-labels. By assuming that pseudo-labels for the same object must be consistent across different views, we devise a novel mechanism for producing refined predictions from the consensus among observations. Our approach improves the off-the-shelf object detector by 2.66% in terms of mAP and outperforms the current state of the art without relying on ground-truth annotations.

arxiv情報

著者 Gianluca Scarpellini,Stefano Rosa,Pietro Morerio,Lorenzo Natale,Alessio Del Bue
発行日 2023-02-21 12:20:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク