要約
我々は、物体の 3D ジオメトリが正確な 3D モデルとしてではなく近似的にのみ与えられる単一画像から物体の 6D 姿勢を推定する新しい手法を提案します。
これを達成するために、ピクセルごとに 3D モデル座標を回帰する高密度の 2D から 3D 対応予測子を採用します。
3D 座標に加えて、モデルはピクセル単位の座標誤差も推定して、間違っている可能性のある対応関係を破棄します。
これにより、オブジェクトの複数の 6D 姿勢仮説を生成し、高効率の領域ベースのアプローチを使用して反復的に改良することができます。
また、各仮説の確率を推定し、最も可能性の高い仮説を選択できる新しいピクセルごとの事後定式化も導入します。
実験で示したように、私たちのアプローチは、露出オーバー、高コントラスト、または低い信号対雑音比などの極端な視覚条件に対処できます。
これにより、軌道上のロボット用途で転倒する衛星の姿勢を推定するという特に困難なタスクにとって強力な技術となります。
私たちの手法は SPEED+ データセットで最先端のパフォーマンスを実現し、SPEC2021 事後分析コンテストで優勝しました。
要約(オリジナル)
We present a novel technique to estimate the 6D pose of objects from single images where the 3D geometry of the object is only given approximately and not as a precise 3D model. To achieve this, we employ a dense 2D-to-3D correspondence predictor that regresses 3D model coordinates for every pixel. In addition to the 3D coordinates, our model also estimates the pixel-wise coordinate error to discard correspondences that are likely wrong. This allows us to generate multiple 6D pose hypotheses of the object, which we then refine iteratively using a highly efficient region-based approach. We also introduce a novel pixel-wise posterior formulation by which we can estimate the probability for each hypothesis and select the most likely one. As we show in experiments, our approach is capable of dealing with extreme visual conditions including overexposure, high contrast, or low signal-to-noise ratio. This makes it a powerful technique for the particularly challenging task of estimating the pose of tumbling satellites for in-orbit robotic applications. Our method achieves state-of-the-art performance on the SPEED+ dataset and has won the SPEC2021 post-mortem competition.
arxiv情報
著者 | Maximilian Ulmer,Maximilian Durner,Martin Sundermeyer,Manuel Stoiber,Rudolph Triebel |
発行日 | 2023-06-21 14:36:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google