Ontology-aware Network for Zero-shot Sketch-based Image Retrieval


Zero-Shot Sketch-Based Image Retrieval (ZSSBIR) は新しいタスクです。
先駆的な研究はモーダル ギャップに焦点を当てていましたが、クラス間の情報は無視していました。
これらの問題に対応するために、オントロジー認識ネットワーク (OAN) が提案されています。
大規模な実験により、2 つの挑戦的な Sketchy および Tu-Berlin データセットに対するアルゴリズムの優れたパフォーマンスが実証されました。


Zero-Shot Sketch-Based Image Retrieval (ZSSBIR) is an emerging task. The pioneering work focused on the modal gap but ignored inter-class information. Although recent work has begun to consider the triplet-based or contrast-based loss to mine inter-class information, positive and negative samples need to be carefully selected, or the model is prone to lose modality-specific information. To respond to these issues, an Ontology-Aware Network (OAN) is proposed. Specifically, the smooth inter-class independence learning mechanism is put forward to maintain inter-class peculiarity. Meanwhile, distillation-based consistency preservation is utilized to keep modality-specific information. Extensive experiments have demonstrated the superior performance of our algorithm on two challenging Sketchy and Tu-Berlin datasets.


著者 Haoxiang Zhang,He Jiang,Ziqiang Wang,Deqiang Cheng
発行日 2023-02-20 15:44:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク