Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification

要約

Wildlife ReID には、視覚テクノロジーを利用してさまざまなシナリオで野生動物の特定の個体を識別することが含まれており、野生動物の保護、生態学的研究、環境モニタリングにとって重要な意味を持っています。
既存の野生生物の ReID 手法は、主に特定の種に合わせて調整されており、適用性が限られています。
一部のアプローチは広範囲に研究された人物 ReID 技術を活用していますが、野生動物によってもたらされる特有の課題に対処するのに苦労しています。
したがって、この論文では、野生生物 ReID のための統一された複数種の一般的なフレームワークを提示します。
高周波情報はさまざまな種の固有の特徴を一貫して表現しており、輪郭や毛皮の質感などの詳細を識別するのに大きく役立つことを考慮して、高周波情報の学習を強化することを目的とした適応高周波トランスフォーマーモデルを提案します。
荒野環境における避けられない高周波干渉を軽減するために、より貴重な高周波成分を適応的に捕捉するオブジェクト認識高周波選択戦略を導入します。
特に、ReID 用に複数の野生動物データセットの実験設定を統合し、最先端の ReID 手法を上回る優れたパフォーマンスを実現しています。
ドメイン一般化シナリオでは、私たちのアプローチは未知の種に対する堅牢な一般化を実証します。

要約(オリジナル)

Wildlife ReID involves utilizing visual technology to identify specific individuals of wild animals in different scenarios, holding significant importance for wildlife conservation, ecological research, and environmental monitoring. Existing wildlife ReID methods are predominantly tailored to specific species, exhibiting limited applicability. Although some approaches leverage extensively studied person ReID techniques, they struggle to address the unique challenges posed by wildlife. Therefore, in this paper, we present a unified, multi-species general framework for wildlife ReID. Given that high-frequency information is a consistent representation of unique features in various species, significantly aiding in identifying contours and details such as fur textures, we propose the Adaptive High-Frequency Transformer model with the goal of enhancing high-frequency information learning. To mitigate the inevitable high-frequency interference in the wilderness environment, we introduce an object-aware high-frequency selection strategy to adaptively capture more valuable high-frequency components. Notably, we unify the experimental settings of multiple wildlife datasets for ReID, achieving superior performance over state-of-the-art ReID methods. In domain generalization scenarios, our approach demonstrates robust generalization to unknown species.

arxiv情報

著者 Chenyue Li,Shuoyi Chen,Mang Ye
発行日 2024-10-25 14:13:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク