A Probabilistic Relaxation of the Two-Stage Object Pose Estimation Paradigm


既存の物体の姿勢推定方法は一般に、1 対 1 の点マッチング ステップを必要とし、それらを連続する 2 つの段階に分割する必要があります。つまり、視覚的対応検出 (たとえば、認識フロントエンドの一部として特徴記述子を照合することによる) とそれに続く幾何学的位置合わせです。
その代わりに、我々は 2 つの主な利点を持つマッチングフリーの確率的定式化を提案します。i) 視覚的な対応と幾何学的位置合わせの両方の統合的かつ同時最適化が可能になり、ii) 可能性の高いポーズの分布全体のさまざまなもっともらしいモードを表現できます。
これにより、テクスチャのない、対称的、または遮蔽されたオブジェクトやシーンなど、正しいポーズが不確実であるかポーズが存在するシーンなど、ポイント間で 1 対 1 の一致を確立することが概念的に定義されていない幾何学的認識シナリオをより適切に処理できるようになります。


Existing object pose estimation methods commonly require a one-to-one point matching step that forces them to be separated into two consecutive stages: visual correspondence detection (e.g., by matching feature descriptors as part of a perception front-end) followed by geometric alignment (e.g., by optimizing a robust estimation objective for pointcloud registration or perspective-n-point). Instead, we propose a matching-free probabilistic formulation with two main benefits: i) it enables unified and concurrent optimization of both visual correspondence and geometric alignment, and ii) it can represent different plausible modes of the entire distribution of likely poses. This in turn allows for a more graceful treatment of geometric perception scenarios where establishing one-to-one matches between points is conceptually ill-defined, such as textureless, symmetrical and/or occluded objects and scenes where the correct pose is uncertain or there are multiple equally valid solutions.


著者 Onur Beker
発行日 2023-06-01 16:50:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク