Revealing the Proximate Long-Tail Distribution in Compositional Zero-Shot Learning

要約

構成的ゼロショット学習 (CZSL) は、既知の状態とオブジェクトのペアから新しい未見のペアに知識を伝達することを目的としています。
このプロセスでは、状態とオブジェクトの組み合わせの多様な相互関係によって引き起こされる視覚的なバイアスにより、その視覚的な特徴がぼやけ、区別可能なクラス プロトタイプの学習が妨げられます。
一般的な手法は、データの観点から生じる可能性のある拡張機能を無視して、状態とオブジェクトを視覚的な特徴から直接解き放つことに重点を置いています。
実験的に、上記の問題によって引き起こされた結果がロングテール分布に非常に近似していることを明らかにしました。
解決策として、CZSL を近接クラス不均衡問題に変換します。
CZSL のロングテール分布内でのクラス事前分布の役割を数学的に推定します。
この洞察に基づいて、構成によって引き起こされる視覚的なバイアスを、事前クラスとして推定することによって、分類器のトレーニングと推論に組み込みます。
この機能強化により、分類器は各構成についてより識別可能なクラス プロトタイプを取得することが促進され、それによってよりバランスのとれた予測が実現されます。
実験結果は、私たちのアプローチが追加のパラメーターを導入することなくモデルのパフォーマンスを最先端のレベルに引き上げることを示しています。
私たちのコードは \url{https://github.com/LanchJL/ProLT-CZSL} で入手できます。

要約(オリジナル)

Compositional Zero-Shot Learning (CZSL) aims to transfer knowledge from seen state-object pairs to novel unseen pairs. In this process, visual bias caused by the diverse interrelationship of state-object combinations blurs their visual features, hindering the learning of distinguishable class prototypes. Prevailing methods concentrate on disentangling states and objects directly from visual features, disregarding potential enhancements that could arise from a data viewpoint. Experimentally, we unveil the results caused by the above problem closely approximate the long-tailed distribution. As a solution, we transform CZSL into a proximate class imbalance problem. We mathematically deduce the role of class prior within the long-tailed distribution in CZSL. Building upon this insight, we incorporate visual bias caused by compositions into the classifier’s training and inference by estimating it as a proximate class prior. This enhancement encourages the classifier to acquire more discernible class prototypes for each composition, thereby achieving more balanced predictions. Experimental results demonstrate that our approach elevates the model’s performance to the state-of-the-art level, without introducing additional parameters. Our code is available at \url{https://github.com/LanchJL/ProLT-CZSL}.

arxiv情報

著者 Chenyi Jiang,Haofeng Zhang
発行日 2023-12-26 07:35:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク