HiPose: Hierarchical Binary Surface Encoding and Correspondence Pruning for RGB-D 6DoF Object Pose Estimation

要約

この研究では、単一の RGB-D 画像から 6DoF オブジェクトの姿勢を推定するための新しい高密度対応法を提案します。
多くの既存のデータ駆動型手法は優れたパフォーマンスを実現しますが、レンダリングベースの改良アプローチに依存しているため、時間がかかる傾向があります。
この制限を回避するために、階層的なバイナリ サーフェス エンコーディングを使用して、粗い方法から細かい方法まで 3D-3D 対応を確立する HiPose を紹介します。
以前の密な対応方法とは異なり、点対面のマッチングを採用し、外れ値を徐々に除去しながら対応点になるまで繰り返し曲面を狭めることによって対応曲面を推定します。
公開ベンチマーク LM-O、YCB-V、および T-Less に関する広範な実験により、私たちの手法がリファインメントを必要としないすべての手法を上回り、高価なリファインメントベースのアプローチと同等であることが実証されました。
重要なのは、私たちのアプローチは計算効率が高く、高精度が要求されるリアルタイムの重要なアプリケーションを可能にします。

要約(オリジナル)

In this work, we present a novel dense-correspondence method for 6DoF object pose estimation from a single RGB-D image. While many existing data-driven methods achieve impressive performance, they tend to be time-consuming due to their reliance on rendering-based refinement approaches. To circumvent this limitation, we present HiPose, which establishes 3D-3D correspondences in a coarse-to-fine manner with a hierarchical binary surface encoding. Unlike previous dense-correspondence methods, we estimate the correspondence surface by employing point-to-surface matching and iteratively constricting the surface until it becomes a correspondence point while gradually removing outliers. Extensive experiments on public benchmarks LM-O, YCB-V, and T-Less demonstrate that our method surpasses all refinement-free methods and is even on par with expensive refinement-based approaches. Crucially, our approach is computationally efficient and enables real-time critical applications with high accuracy requirements.

arxiv情報

著者 Yongliang Lin,Yongzhi Su,Praveen Nathan,Sandeep Inuganti,Yan Di,Martin Sundermeyer,Fabian Manhardt,Didier Stricke,Jason Rambach,Yu Zhang
発行日 2024-03-31 12:06:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク