Incremental Few-Shot Object Detection via Simple Fine-Tuning Approach

要約

このホワイトペーパーでは、基本クラスを再検討することなく、いくつかの例のみを使用して新しいクラスを段階的に学習するインクリメンタル フューズ ショット オブジェクト検出 (iFSD) について説明します。
以前の iFSD の作業は、メタ学習を適用することによって望ましい結果を達成しました。
しかし、メタ学習のアプローチは、実用的な問題に適用するのが難しい不十分なパフォーマンスを示しています。
この観点から、単純な微調整ベースのアプローチである iFSD のインクリメンタル 2 段階微調整アプローチ (iTFA) を提案します。これには 3 つのステップが含まれます。
、2) 基本知識を保持するための RoI 特徴抽出器と分類子の基本クラス分岐と新規クラス分岐への分離、および 3) 少数の新規クラスの例のみを使用した新規分岐の微調整。
実世界のデータセット PASCAL VOC、COCO、および LVIS で iTFA を評価します。
iTFA は、COCO で競争力のあるパフォーマンスを達成し、LVIS データセットのメタ学習方法よりも 30% 高い AP 精度を示しています。
実験結果は、提案した方法の有効性と適用性を示しています。

要約(オリジナル)

In this paper, we explore incremental few-shot object detection (iFSD), which incrementally learns novel classes using only a few examples without revisiting base classes. Previous iFSD works achieved the desired results by applying meta-learning. However, meta-learning approaches show insufficient performance that is difficult to apply to practical problems. In this light, we propose a simple fine-tuning-based approach, the Incremental Two-stage Fine-tuning Approach (iTFA) for iFSD, which contains three steps: 1) base training using abundant base classes with the class-agnostic box regressor, 2) separation of the RoI feature extractor and classifier into the base and novel class branches for preserving base knowledge, and 3) fine-tuning the novel branch using only a few novel class examples. We evaluate our iTFA on the real-world datasets PASCAL VOC, COCO, and LVIS. iTFA achieves competitive performance in COCO and shows a 30% higher AP accuracy than meta-learning methods in the LVIS dataset. Experimental results show the effectiveness and applicability of our proposed method.

arxiv情報

著者 Tae-Min Choi,Jong-Hwan Kim
発行日 2023-02-20 05:48:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク