Multi-View Keypoints for Reliable 6D Object Pose Estimation

要約

6D オブジェクトの姿勢推定は、環境との効率的な相互作用を可能にするロボティクスの基本コンポーネントです。
多くのオブジェクトが低機能で反射的であり、同じタイプのオブジェクト間の自己閉塞が一般的であるビンピッキングアプリケーションでは特に困難です。
ヒートマップとキーポイントの推定値を 3D 空間上の確率密度マップに結合するために、目の手のセットアップからの既知のカメラ変換を活用する新しいマルチビュー アプローチを提案します。
その結果、ビューの数を拡張できる堅牢なアプローチが実現します。
これは、キーポイントの確率と点群の位置合わせエラーで構成される信頼スコアに依存しているため、誤検知を確実に拒否できます。
ROBI データセット内のさまざまな困難な低機能および反射オブジェクト全体で約 0.5 mm および 2 度の平均姿勢推定誤差を示し、10% のオブジェクト直径を使用して測定された最先端の正しい検出率も上回っています。
ADD エラーのしきい値。

要約(オリジナル)

6D Object pose estimation is a fundamental component in robotics enabling efficient interaction with the environment. It is particularly challenging in bin-picking applications, where many objects are low-feature and reflective, and self-occlusion between objects of the same type is common. We propose a novel multi-view approach leveraging known camera transformations from an eye-in-hand setup to combine heatmap and keypoint estimates into a probability density map over 3D space. The result is a robust approach that is scalable in the number of views. It relies on a confidence score composed of keypoint probabilities and point-cloud alignment error, which allows reliable rejection of false positives. We demonstrate an average pose estimation error of approximately 0.5mm and 2 degrees across a variety of difficult low-feature and reflective objects in the ROBI dataset, while also surpassing the state-of-art correct detection rate, measured using the 10% object diameter threshold on ADD error.

arxiv情報

著者 Alan Li,Angela P. Schoellig
発行日 2023-03-29 16:28:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク