TTT-UCDR: Test-time Training for Universal Cross-Domain Retrieval


一般化されたテスト シナリオでの画像検索は、文献で大きな勢いを得ており、最近提案された Universal Cross-domain Retrieval プロトコルは、この方向のパイオニアです。
小さなクロスドメイン データセット (2 つのトレーニング ドメインのみを含む) でトレーニングされた検索モデルを、推論中にテスト データにすばやく適応させることで、未知のクエリ ドメインまたはカテゴリに対してより一般化できるようにします。
この形式のテスト時間トレーニングまたは検索モデルの適応は、この作業では、Rotnet、ジグソー パズル、Barlow Twins など、多数の自己監視ベースの損失関数によって調査されます。


Image retrieval under generalized test scenarios has gained significant momentum in literature, and the recently proposed protocol of Universal Cross-domain Retrieval is a pioneer in this direction. A common practice in any such generalized classification or retrieval algorithm is to exploit samples from multiple domains during training to learn a domain-invariant representation of data. Such criterion is often restrictive, and thus in this work, for the first time, we explore the challenges associated with generalized retrieval problems under a low-data regime, which is quite relevant in many real-world scenarios. We attempt to make any retrieval model trained on a small cross-domain dataset (containing just two training domains) more generalizable towards any unknown query domain or category by quickly adapting it to the test data during inference. This form of test-time training or adaptation of the retrieval model is explored by means of a number of self-supervision-based loss functions, for example, Rotnet, Jigsaw-puzzle, Barlow twins, etc., in this work. Extensive experiments on multiple large-scale datasets demonstrate the effectiveness of the proposed approach.


著者 Soumava Paul,Titir Dutta,Aheli Saha,Abhishek Samanta,Soma Biswas
発行日 2023-01-19 22:14:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク