MeanAP-Guided Reinforced Active Learning for Object Detection

要約

アクティブ ラーニングは、ラベル付けする最も有益なインスタンスを慎重に選択し、それらをタスク学習器に組み込むことによって達成される、最小限のラベル付きデータで高性能モデルをトレーニングするための有望な手段を提供します。
画像認識のアクティブラーニングは目覚ましい進歩を遂げているにもかかわらず、クエリ戦略の設計に不可欠なデータの情報利得を測定するために考案または学習されたメトリックは、物体検出タスクの平均平均精度 (MeanAP) などのタスク モデルのパフォーマンス メトリックと一貫して一致していません。

このペーパーでは、タスク モデルの MeanAP メトリクスを直接利用して、強化学習ベースのサンプリング エージェントを使用したサンプリング戦略を考案する新しいアプローチである、MeanAP ガイドによるオブジェクト検出のための強化アクティブ学習 (MAGRAL) を紹介します。
LSTM アーキテクチャに基づいて構築されたエージェントは、後続のトレーニング インスタンスを効率的に探索して選択し、報酬として MeanAP を使用してポリシー勾配を通じてプロセスを最適化します。
各ステップでの MeanAP 計算には時間がかかる性質を認識し、エージェントのトレーニングを促進する高速ルックアップ テーブルを提案します。
私たちは、さまざまなバックボーン アーキテクチャを利用して、人気のあるベンチマークである PASCAL VOC と MS COCO にわたって MAGRAL の有効性を評価します。
経験的な発見は、最近の最先端の方法に対する MAGRAL の優位性を実証し、大幅なパフォーマンスの向上を示しています。
MAGRAL は、強化されたアクティブ オブジェクト検出のための堅牢なベースラインを確立し、この分野を前進させる可能性を示しています。

要約(オリジナル)

Active learning presents a promising avenue for training high-performance models with minimal labeled data, achieved by judiciously selecting the most informative instances to label and incorporating them into the task learner. Despite notable advancements in active learning for image recognition, metrics devised or learned to gauge the information gain of data, crucial for query strategy design, do not consistently align with task model performance metrics, such as Mean Average Precision (MeanAP) in object detection tasks. This paper introduces MeanAP-Guided Reinforced Active Learning for Object Detection (MAGRAL), a novel approach that directly utilizes the MeanAP metric of the task model to devise a sampling strategy employing a reinforcement learning-based sampling agent. Built upon LSTM architecture, the agent efficiently explores and selects subsequent training instances, and optimizes the process through policy gradient with MeanAP serving as reward. Recognizing the time-intensive nature of MeanAP computation at each step, we propose fast look-up tables to expedite agent training. We assess MAGRAL’s efficacy across popular benchmarks, PASCAL VOC and MS COCO, utilizing different backbone architectures. Empirical findings substantiate MAGRAL’s superiority over recent state-of-the-art methods, showcasing substantial performance gains. MAGRAL establishes a robust baseline for reinforced active object detection, signifying its potential in advancing the field.

arxiv情報

著者 Zhixuan Liang,Xingyu Zeng,Rui Zhao,Ping Luo
発行日 2023-10-12 14:59:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク