PromptCCD: Learning Gaussian Mixture Prompt Pool for Continual Category Discovery

要約

私たちは、継続的カテゴリ発見 (CCD) の問題に取り組みます。これは、壊滅的な忘却という課題を軽減しながら、ラベルのないデータの連続ストリームから新しいカテゴリを自動的に発見することを目的としています。この未解決の問題は、従来の完全に教師付きの継続的学習でも発生します。
この課題に対処するために、CCD のプロンプト方法としてガウス混合モデル (GMM) を利用するシンプルかつ効果的なフレームワークである PromptCCD を提案します。
PromptCCD の中核には、ガウス混合プロンプティング (GMP) モジュールがあります。これは、時間の経過とともに更新される動的プールとして機能し、表現の学習を促進し、カテゴリ検出中の忘れを防ぎます。
さらに、GMP はカテゴリ番号のオンザフライ推定を可能にし、PromptCCD がカテゴリ番号の事前知識がなくてもラベルなしデータ内のカテゴリを検出できるようにします。
私たちは、Generalized Category Discovery (GCD) の標準評価指標を CCD に拡張し、さまざまな公開データセットで最先端の手法をベンチマークします。
PromptCCD は既存の手法を大幅に上回り、その有効性を示しています。
プロジェクトページ: https://visual-ai.github.io/promptccd 。

要約(オリジナル)

We tackle the problem of Continual Category Discovery (CCD), which aims to automatically discover novel categories in a continuous stream of unlabeled data while mitigating the challenge of catastrophic forgetting — an open problem that persists even in conventional, fully supervised continual learning. To address this challenge, we propose PromptCCD, a simple yet effective framework that utilizes a Gaussian Mixture Model (GMM) as a prompting method for CCD. At the core of PromptCCD lies the Gaussian Mixture Prompting (GMP) module, which acts as a dynamic pool that updates over time to facilitate representation learning and prevent forgetting during category discovery. Moreover, GMP enables on-the-fly estimation of category numbers, allowing PromptCCD to discover categories in unlabeled data without prior knowledge of the category numbers. We extend the standard evaluation metric for Generalized Category Discovery (GCD) to CCD and benchmark state-of-the-art methods on diverse public datasets. PromptCCD significantly outperforms existing methods, demonstrating its effectiveness. Project page: https://visual-ai.github.io/promptccd .

arxiv情報

著者 Fernando Julio Cendra,Bingchen Zhao,Kai Han
発行日 2024-09-09 16:43:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク