要約
Video Copy Detection (VCD) は、不正または複製されたビデオコンテンツのインスタンスを識別するために開発されています。本論文では、CVPR 2023 の Meta AI Video Similarity Challenge (VSC22) で 2 位になったソリューションを紹介します。このチャレンジに出場するために、我々はVCDのための特徴適合型漸進学習(FCPL)を提案します。FCPLは、相互に互換性のある特徴を生成する様々なモデルを学習します。つまり、複数の異なるモデルから得られる特徴を、互いに直接比較することができるのです。この相互互換性により、特徴量アンサンブルが可能になることを見出した。漸進的な学習を実施し、ラベル付きのグランドトゥルースペアを利用することで、効果的に徐々に性能を向上させることができる。実験結果は、提案するFCPLが他の競合他社よりも優れていることを示す。我々のコードは、https://github.com/WangWenhao0716/VSC-DescriptorTrack-Submission と https://github.com/WangWenhao0716/VSC-MatchingTrack-Submission で利用可能である。
要約(オリジナル)
Video Copy Detection (VCD) has been developed to identify instances of unauthorized or duplicated video content. This paper presents our second place solutions to the Meta AI Video Similarity Challenge (VSC22), CVPR 2023. In order to compete in this challenge, we propose Feature-Compatible Progressive Learning (FCPL) for VCD. FCPL trains various models that produce mutually-compatible features, meaning that the features derived from multiple distinct models can be directly compared with one another. We find this mutual compatibility enables feature ensemble. By implementing progressive learning and utilizing labeled ground truth pairs, we effectively gradually enhance performance. Experimental results demonstrate the superiority of the proposed FCPL over other competitors. Our code is available at https://github.com/WangWenhao0716/VSC-DescriptorTrack-Submission and https://github.com/WangWenhao0716/VSC-MatchingTrack-Submission.
arxiv情報
著者 | Wenhao Wang,Yifan Sun,Yi Yang |
発行日 | 2023-05-12 17:26:39+00:00 |
arxivサイト | arxiv_id(pdf) |