要約
オブジェクトの姿勢推定は、コンピューター ビジョンの中核的な問題であり、多くの場合、ロボット工学の重要な要素です。
姿勢の推定は、通常、オブジェクトの姿勢の単一の最良の推定を求めることによってアプローチされますが、このアプローチは、視覚的なあいまいさを伴うタスクには適していません。
このような場合、下流のタスクが情報に基づいた決定を下せるように、姿勢分布として不確実性を推定することが望ましいです。
ポーズ分布は、パラメーター化されていない分布を推定する動機となる任意の複雑さを持つことができますが、SE(3) でのトレーニングと正規化が難しいため、これまで SO(3) での方向推定にのみ使用されてきました。
SE(3) のポーズ分布推定のための新しい方法を提案します。
階層グリッド、ピラミッドを使用します。これにより、トレーニング中の効率的な重要性サンプリングと、推論時のピラミッドのスパース評価が可能になり、リアルタイムの 6D ポーズ分布推定が可能になります。
私たちの方法は、SO(3) の最先端の方法よりも優れており、私たちの知る限り、SE(3) の姿勢分布推定に関する最初の定量的結果を提供します。
コードは spyropose.github.io で入手できます
要約(オリジナル)
Object pose estimation is a core computer vision problem and often an essential component in robotics. Pose estimation is usually approached by seeking the single best estimate of an object’s pose, but this approach is ill-suited for tasks involving visual ambiguity. In such cases it is desirable to estimate the uncertainty as a pose distribution to allow downstream tasks to make informed decisions. Pose distributions can have arbitrary complexity which motivates estimating unparameterized distributions, however, until now they have only been used for orientation estimation on SO(3) due to the difficulty in training on and normalizing over SE(3). We propose a novel method for pose distribution estimation on SE(3). We use a hierarchical grid, a pyramid, which enables efficient importance sampling during training and sparse evaluation of the pyramid at inference, allowing real time 6D pose distribution estimation. Our method outperforms state-of-the-art methods on SO(3), and to the best of our knowledge, we provide the first quantitative results on pose distribution estimation on SE(3). Code will be available at spyropose.github.io
arxiv情報
著者 | Rasmus Laurvig Haugaard,Frederik Hagelskjær,Thorbjørn Mosekjær Iversen |
発行日 | 2023-03-09 14:58:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google