SpyroPose: SE(3) Pyramids for Object Pose Distribution Estimation

要約

物体の姿勢推定は、コンピュータビジョンの中核をなす問題であり、しばしばロボット工学において不可欠な要素である。姿勢推定は通常、物体の姿勢の単一の最良推定値を求めることによってアプローチされるが、このアプローチは視覚的曖昧さを伴うタスクには不向きである。このような場合、不確実性をポーズ分布として推定し、下流のタスクが情報に基づいた決定を行えるようにすることが望ましい。しかし、SE(3)上での学習や正規化が難しいため、これまではSO(3)上での姿勢推定にしか用いられてこなかった。我々は、SE(3)上の姿勢分布推定のための新しい手法を提案する。階層的なグリッドであるピラミッドを用いることで、学習時の効率的な重要度サンプリングと推論時のピラミッドの疎な評価を可能にし、実時間での6次元姿勢分布推定を可能にする。また、我々の知る限り、SE(3)上でのポーズ分布推定に関する最初の定量的結果を提供する。コードはspyropose.github.ioで公開予定。

要約(オリジナル)

Object pose estimation is a core computer vision problem and often an essential component in robotics. Pose estimation is usually approached by seeking the single best estimate of an object’s pose, but this approach is ill-suited for tasks involving visual ambiguity. In such cases it is desirable to estimate the uncertainty as a pose distribution to allow downstream tasks to make informed decisions. Pose distributions can have arbitrary complexity which motivates estimating unparameterized distributions, however, until now they have only been used for orientation estimation on SO(3) due to the difficulty in training on and normalizing over SE(3). We propose a novel method for pose distribution estimation on SE(3). We use a hierarchical grid, a pyramid, which enables efficient importance sampling during training and sparse evaluation of the pyramid at inference, allowing real time 6D pose distribution estimation. Our method outperforms state-of-the-art methods on SO(3), and to the best of our knowledge, we provide the first quantitative results on pose distribution estimation on SE(3). Code will be available at spyropose.github.io

arxiv情報

著者 Rasmus Laurvig Haugaard,Frederik Hagelskjær,Thorbjørn Mosekjær Iversen
発行日 2024-01-03 11:12:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.RO パーマリンク