MuRAL: Multi-Scale Region-based Active Learning for Object Detection

要約

大規模なラベル付きオブジェクト検出データセットを取得するには、バウンディング ボックスとクラス ラベルで画像に注釈を付ける必要があるため、コストと時間がかかる可能性があります。
したがって、ラベル付けのためにラベル付けされていないデータから粗粒度のサンプルまたは細粒度のインスタンスのいずれかを選択することにより、コストを削減するために、いくつかの特殊な能動学習方法が提案されています。
ただし、前者のアプローチは冗長なラベル付けに悩まされますが、後者の方法は一般にトレーニングの不安定性とサンプリングバイアスにつながります。
これらの課題に対処するために、オブジェクト検出のためのマルチスケール リージョンベース アクティブ ラーニング (MuRAL) と呼ばれる新しいアプローチを提案します。
MuRAL は、さまざまなスケールの有益な領域を識別して、十分に学習されたオブジェクトの注釈コストを削減し、トレーニング パフォーマンスを向上させます。
有益な領域スコアは、インスタンスの予測された信頼度と各オブジェクト カテゴリの分布の両方を考慮するように設計されているため、検出が困難なクラスにより焦点を当てることができます。
さらに、MuRAL はスケールを意識した選択戦略を採用しており、ラベリングとダウンストリームの微調整のためにさまざまなスケールから多様な領域が選択されることを保証し、トレーニングの安定性を高めます。
私たちが提案した方法は、Cityscapes および MS COCO データセットの既存のすべての粗粒度および細粒度のベースラインを上回り、困難なカテゴリのパフォーマンスが大幅に改善されたことを示しています。

要約(オリジナル)

Obtaining large-scale labeled object detection dataset can be costly and time-consuming, as it involves annotating images with bounding boxes and class labels. Thus, some specialized active learning methods have been proposed to reduce the cost by selecting either coarse-grained samples or fine-grained instances from unlabeled data for labeling. However, the former approaches suffer from redundant labeling, while the latter methods generally lead to training instability and sampling bias. To address these challenges, we propose a novel approach called Multi-scale Region-based Active Learning (MuRAL) for object detection. MuRAL identifies informative regions of various scales to reduce annotation costs for well-learned objects and improve training performance. The informative region score is designed to consider both the predicted confidence of instances and the distribution of each object category, enabling our method to focus more on difficult-to-detect classes. Moreover, MuRAL employs a scale-aware selection strategy that ensures diverse regions are selected from different scales for labeling and downstream finetuning, which enhances training stability. Our proposed method surpasses all existing coarse-grained and fine-grained baselines on Cityscapes and MS COCO datasets, and demonstrates significant improvement in difficult category performance.

arxiv情報

著者 Yi-Syuan Liou,Tsung-Han Wu,Jia-Fong Yeh,Wen-Chin Chen,Winston H. Hsu
発行日 2023-03-29 12:52:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク