Bi-directional Distribution Alignment for Transductive Zero-Shot Learning

要約

ゼロ ショット学習 (ZSL) がドメイン シフトの問題に悩まされる可能性があることはよく知られています。ドメイン シフトでは、目に見えないクラスの真のデータ分布と学習されたデータ分布が一致しません。
トランスダクティブ ZSL (TZSL) は、目に見えないクラスからのラベルのない例を使用できるようにすることでこれを改善しようとしますが、依然として高レベルの分布シフトがあります。
新しい TZSL モデル (Bi-VAEGAN と呼ばれる) を提案します。これは、視覚空間と補助空間の間の分布の配置を強化することによってシフトを大幅に改善します。
モデル設計の重要な提案には、(1) 双方向の分布アラインメント、(2) シンプルだが効果的な L_2 ノルム ベースの特徴正規化アプローチ、および (3) より洗練された見えないクラスの事前推定アプローチが含まれます。
4 つのデータセットを使用したベンチマーク評価では、Bi-VAEGAN は、標準および一般化された TZSL 設定の両方で新しい最先端の技術を実現しています。
コードは https://github.com/Zhicaiwww/Bi-VAEGAN にあります。

要約(オリジナル)

It is well-known that zero-shot learning (ZSL) can suffer severely from the problem of domain shift, where the true and learned data distributions for the unseen classes do not match. Although transductive ZSL (TZSL) attempts to improve this by allowing the use of unlabelled examples from the unseen classes, there is still a high level of distribution shift. We propose a novel TZSL model (named as Bi-VAEGAN), which largely improves the shift by a strengthened distribution alignment between the visual and auxiliary spaces. The key proposal of the model design includes (1) a bi-directional distribution alignment, (2) a simple but effective L_2-norm based feature normalization approach, and (3) a more sophisticated unseen class prior estimation approach. In benchmark evaluation using four datasets, Bi-VAEGAN achieves the new state of the arts under both the standard and generalized TZSL settings. Code could be found at https://github.com/Zhicaiwww/Bi-VAEGAN

arxiv情報

著者 Zhicai Wang,Yanbin Hao,Tingting Mu,Ouxiang Li,Shuo Wang,Xiangnan He
発行日 2023-03-15 15:32:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク