Uncertainty Aware Active Learning for Reconfiguration of Pre-trained Deep Object-Detection Networks for New Target Domains

要約

物体検出は、コンピュータ ビジョン タスクの最も重要かつ基本的な側面の 1 つであり、姿勢推定、物体追跡、およびインスタンス セグメンテーション モデルで広く利用されています。
オブジェクト検出モデルのトレーニング データを効率的に取得するために、多くのデータセットは、注釈なしのデータをビデオ形式で取得することを選択しており、アノテーターは画像内の各オブジェクトの周りに境界ボックスを描画する必要があります。
多くのフレームにはモデルが学習するための非常に類似した情報が含まれているため、ビデオのすべてのフレームに注釈を付けるのはコストがかかり、非効率的です。
ビデオから最も有益なフレームを選択して注釈を付ける方法は、解決するための非常に実用的なタスクになっていますが、研究ではほとんど注目されていません。
この論文では、この問題に取り組むために、物体検出モデルの新しい能動学習アルゴリズムを提案しました。
提案された能動学習アルゴリズムでは、ラベル付けされていないデータの分類とローカリゼーションの両方の有益性が測定され、集計されます。
ビデオ フレームからの時間情報を利用して、2 つの新しいローカライゼーションの有益性の測定値が提案されます。
さらに、隣接するフレームのクエリを回避するために、重み曲線が提案されています。
MuPoTS データセットと FootballPD データセットで、複数の構成を持つ提案されたアクティブ ラーニング アルゴリズムが評価されました。

要約(オリジナル)

Object detection is one of the most important and fundamental aspects of computer vision tasks, which has been broadly utilized in pose estimation, object tracking and instance segmentation models. To obtain training data for object detection model efficiently, many datasets opt to obtain their unannotated data in video format and the annotator needs to draw a bounding box around each object in the images. Annotating every frame from a video is costly and inefficient since many frames contain very similar information for the model to learn from. How to select the most informative frames from a video to annotate has become a highly practical task to solve but attracted little attention in research. In this paper, we proposed a novel active learning algorithm for object detection models to tackle this problem. In the proposed active learning algorithm, both classification and localization informativeness of unlabelled data are measured and aggregated. Utilizing the temporal information from video frames, two novel localization informativeness measurements are proposed. Furthermore, a weight curve is proposed to avoid querying adjacent frames. Proposed active learning algorithm with multiple configurations was evaluated on the MuPoTS dataset and FootballPD dataset.

arxiv情報

著者 Jiaming Na,Varuna De-Silva
発行日 2023-03-22 17:14:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.HC パーマリンク