Extending 6D Object Pose Estimators for Stereo Vision

要約

オブジェクトの 6D 姿勢を正確、迅速、かつ確実に推定することは、依然として困難な作業です。
ただし、密な特徴を使用して RGB 画像からポーズを直接回帰する最近の方法では、最先端の結果が得られています。
オブジェクトに対する追加の視点を提供するステレオ ビジョンは、ポーズの曖昧さと遮蔽を軽減するのに役立ちます。
さらに、ステレオは物体の距離を直接推測できますが、モノビジョンでは物体のサイズについての内部化された知識が必要です。
最先端の 6D オブジェクト姿勢推定をステレオに拡張するために、YCB-V データセットの BOP 互換ステレオ バージョンを作成しました。
私たちの方法は、ステレオビジョンを利用することで最先端の 6D 姿勢推定アルゴリズムを上回り、他の高密度特徴ベースのアルゴリズムにも簡単に採用できます。

要約(オリジナル)

Estimating the 6D pose of objects accurately, quickly, and robustly remains a difficult task. However, recent methods for directly regressing poses from RGB images using dense features have achieved state-of-the-art results. Stereo vision, which provides an additional perspective on the object, can help reduce pose ambiguity and occlusion. Moreover, stereo can directly infer the distance of an object, while mono-vision requires internalized knowledge of the object’s size. To extend the state-of-the-art in 6D object pose estimation to stereo, we created a BOP compatible stereo version of the YCB-V dataset. Our method outperforms state-of-the-art 6D pose estimation algorithms by utilizing stereo vision and can easily be adopted for other dense feature-based algorithms.

arxiv情報

著者 Thomas Pöllabauer,Jan Emrich,Volker Knauthe,Arjan Kuijper
発行日 2024-09-10 13:51:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク