Level Set-Based Camera Pose Estimation From Multiple 2D/3D Ellipse-Ellipsoid Correspondences

要約

この論文では、単一のRGB画像と、楕円体モデルで表されるオブジェクトの事前構築済みマップからのオブジェクトベースのカメラ姿勢推定を提案します。
点対応とは反対に、3D オブジェクトの 2D オブジェクト検出への射影を特徴付けるコスト関数の定義は簡単ではないことを示します。
レベル セットのサンプリングに基づいて楕円 – 楕円コストを作成し、部分的に見えるオブジェクトを処理するための優れた特性を示し、そのパフォーマンスを他の一般的なメトリックと比較します。
最後に、検出された楕円に対する予測の不確実性を使用することで、計算されたポーズを改善する対応の寄与の公正な重み付けが可能になることを示します。
コードは https://gitlab.inria.fr/tangram/level-set-based-camera-pose-estimation で公開されています。

要約(オリジナル)

In this paper, we propose an object-based camera pose estimation from a single RGB image and a pre-built map of objects, represented with ellipsoidal models. We show that contrary to point correspondences, the definition of a cost function characterizing the projection of a 3D object onto a 2D object detection is not straightforward. We develop an ellipse-ellipse cost based on level sets sampling, demonstrate its nice properties for handling partially visible objects and compare its performance with other common metrics. Finally, we show that the use of a predictive uncertainty on the detected ellipses allows a fair weighting of the contribution of the correspondences which improves the computed pose. The code is released at https://gitlab.inria.fr/tangram/level-set-based-camera-pose-estimation.

arxiv情報

著者 Matthieu Zins,Gilles Simon,Marie-Odile Berger
発行日 2022-08-19 13:51:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク