iMatching: Imperative Correspondence Learning


特徴の対応関係の学習はコンピュータ ビジョンの基礎的なタスクであり、ビジュアル オドメトリや 3D 再構成などの下流アプリケーションにとって非常に重要です。
この困難を克服するために、特徴の対応をトレーニングするための新しい自己教師ありスキームである命令型学習 (IL) を導入します。
広範な実験を通じて、特徴マッチングや姿勢推定などのタスクで優れたパフォーマンスを実証し、最先端のマッチング モデルと比較して平均 30% の精度向上が得られました。
このプレプリントは、欧州コンピュータ ビジョン会議 (ECCV) 2024 の受理原稿に対応しています。


Learning feature correspondence is a foundational task in computer vision, holding immense importance for downstream applications such as visual odometry and 3D reconstruction. Despite recent progress in data-driven models, feature correspondence learning is still limited by the lack of accurate per-pixel correspondence labels. To overcome this difficulty, we introduce a new self-supervised scheme, imperative learning (IL), for training feature correspondence. It enables correspondence learning on arbitrary uninterrupted videos without any camera pose or depth labels, heralding a new era for self-supervised correspondence learning. Specifically, we formulated the problem of correspondence learning as a bilevel optimization, which takes the reprojection error from bundle adjustment as a supervisory signal for the model. To avoid large memory and computation overhead, we leverage the stationary point to effectively back-propagate the implicit gradients through bundle adjustment. Through extensive experiments, we demonstrate superior performance on tasks including feature matching and pose estimation, in which we obtained an average of 30% accuracy gain over the state-of-the-art matching models. This preprint corresponds to the Accepted Manuscript in European Conference on Computer Vision (ECCV) 2024.


著者 Zitong Zhan,Dasong Gao,Yun-Jou Lin,Youjie Xia,Chen Wang
発行日 2024-07-31 17:41:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク