要約
埋め込み認識生成モデル (EAGM) は、セマンティック埋め込み空間と視覚埋め込み空間の間にジェネレーターを構築することにより、ゼロショット学習 (ZSL) のデータ不足の問題に対処します。
定義済みのベンチマークとプロトコルのおかげで、ZSL 用に提案された EAGM の数は急速に増加しています。
一歩下がって、埋め込みを意識した生成パラダイムを再考する時が来たと私たちは主張します。
この論文の目的は 3 つあります。
まず、ベンチマーク データセットの現在の埋め込み機能が何らかの形で時代遅れであるという事実を考慮して、埋め込み機能に恥ずかしいほど単純な変更を加えることで、ZSL の EAGM のパフォーマンスを著しく改善します。
結果は、EAGM の埋め込みがより注目に値することを明らかにしているため、これは重要な貢献です。
次に、かなりの数の EAGM を詳細に比較および分析します。
5 つのベンチマーク データセットに基づいて、ZSL の最先端の結果を更新し、古典的な目に見えないクラスの少数ショット学習 (UFSL) とより挑戦的なものを含む少数ショット学習 (FSL) の強力なベースラインを提供します。
見たクラスの少数ショット学習 (SFSL)。
最後に、ZSL および FSL の EAGM のモデル、機能、パラメーター、および設定を含む、包括的な生成モデル リポジトリ、つまり、Generative Any-Shot Learning (GASL) リポジトリが提供されます。
このホワイト ペーパーの結果は、GASL に基づいた 1 つのコマンド ラインだけで簡単に再現できます。
要約(オリジナル)
Embedding-aware generative model (EAGM) addresses the data insufficiency problem for zero-shot learning (ZSL) by constructing a generator between semantic and visual embedding spaces. Thanks to the predefined benchmark and protocols, the number of proposed EAGMs for ZSL is increasing rapidly. We argue that it is time to take a step back and reconsider the embedding-aware generative paradigm. The purpose of this paper is three-fold. First, given the fact that the current embedding features in benchmark datasets are somehow out-of-date, we improve the performance of EAGMs for ZSL remarkably with embarrassedly simple modifications on the embedding features. This is an important contribution, since the results reveal that the embedding of EAGMs deserves more attention. Second, we compare and analyze a significant number of EAGMs in depth. Based on five benchmark datasets, we update the state-of-the-art results for ZSL and give a strong baseline for few-shot learning (FSL), including the classic unseen-class few-shot learning (UFSL) and the more challenging seen-class few-shot learning (SFSL). Finally, a comprehensive generative model repository, namely, generative any-shot learning (GASL) repository, is provided, which contains the models, features, parameters, and settings of EAGMs for ZSL and FSL. Any results in this paper can be readily reproduced with only one command line based on GASL.
arxiv情報
著者 | Liangjun Feng,Jiancheng Zhao,Chunhui Zhao |
発行日 | 2023-02-09 11:31:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google