要約
テクスチャのないオブジェクトの 6D ポーズ推定は、多くのロボット アプリケーションにとって価値はあるものの困難なタスクです。
この作業では、複数の視点から取得した RGB 画像のみを使用して、この課題に対処するためのフレームワークを提案します。
私たちのアプローチの核となる考え方は、6D 姿勢推定を順次 2 ステップのプロセスに分離することです。最初に 3D 平行移動を推定し、次に各オブジェクトの 3D 回転を推定します。
この分離された定式化は、最初に単一の RGB 画像のスケールと深度のあいまいさを解決し、これらの推定値を使用して、第 2 段階でオブジェクトの向きを正確に識別します。これは、正確なスケール推定によって大幅に簡素化されます。
さらに、回転空間に存在するマルチモーダル分布に対応するために、オブジェクトの対称性を明示的に処理し、測定の不確実性を打ち消す最適化スキームを開発します。
最先端のマルチビュー アプローチと比較して、提案されたアプローチが、テクスチャのないオブジェクトの挑戦的な 6D ポーズ推定データセットで大幅な改善を達成することを示します。
要約(オリジナル)
6D pose estimation of textureless objects is a valuable but challenging task for many robotic applications. In this work, we propose a framework to address this challenge using only RGB images acquired from multiple viewpoints. The core idea of our approach is to decouple 6D pose estimation into a sequential two-step process, first estimating the 3D translation and then the 3D rotation of each object. This decoupled formulation first resolves the scale and depth ambiguities in single RGB images, and uses these estimates to accurately identify the object orientation in the second stage, which is greatly simplified with an accurate scale estimate. Moreover, to accommodate the multi-modal distribution present in rotation space, we develop an optimization scheme that explicitly handles object symmetries and counteracts measurement uncertainties. In comparison to the state-of-the-art multi-view approach, we demonstrate that the proposed approach achieves substantial improvements on a challenging 6D pose estimation dataset for textureless objects.
arxiv情報
| 著者 | Jun Yang,Wenjie Xue,Sahar Ghavidel,Steven L. Waslander | 
| 発行日 | 2023-02-21 23:21:14+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
