Alignist: CAD-Informed Orientation Distribution Estimation by Fusing Shape and Correspondences

要約

ロボット工学において、対称オブジェクトのより適切な経路計画と処理のために、オブジェクトの姿勢分布の推定は非常に重要です。
最近の分布推定アプローチでは、CAD モデルがない場合に単一姿勢推定の可能性を最大化することにより、対照的な学習ベースのアプローチが採用されています。
CADモデルを用いて得られる対応分布と形状情報の対称性を利用した姿勢分布推定手法を提案する。
対照学習ベースのアプローチでは、分布を適切に学習するためにさまざまな視点からの徹底的な量のトレーニング画像が必要ですが、現実的なシナリオではこれは不可能です。
代わりに、CAD モデルからの対応分布と形状情報を活用できるパイプラインを提案します。これらは、後で姿勢分布を学習するために使用されます。
さらに、画像に条件付けされた姿勢分布を学習する前に、対応関係に基づく姿勢分布にアクセスできると、分布間の損失を定式化するのに役立ちます。
配信に関する事前知識は、ネットワークが代わりにより鮮明なモードを取得することに集中するのにも役立ちます。
CAD を以前に使用した場合、一度に 1 つのモードに焦点を当てる対照的なアプローチとは異なり、すべての有効なモード付近でよりシャープな分布を学習することに重点を置くことで、私たちのアプローチははるかに高速に収束し、より良く分布を学習します。
SYMSOL-I および T-Less データセットでベンチマーク結果を達成しました。

要約(オリジナル)

Object pose distribution estimation is crucial in robotics for better path planning and handling of symmetric objects. Recent distribution estimation approaches employ contrastive learning-based approaches by maximizing the likelihood of a single pose estimate in the absence of a CAD model. We propose a pose distribution estimation method leveraging symmetry respecting correspondence distributions and shape information obtained using a CAD model. Contrastive learning-based approaches require an exhaustive amount of training images from different viewpoints to learn the distribution properly, which is not possible in realistic scenarios. Instead, we propose a pipeline that can leverage correspondence distributions and shape information from the CAD model, which are later used to learn pose distributions. Besides, having access to pose distribution based on correspondences before learning pose distributions conditioned on images, can help formulate the loss between distributions. The prior knowledge of distribution also helps the network to focus on getting sharper modes instead. With the CAD prior, our approach converges much faster and learns distribution better by focusing on learning sharper distribution near all the valid modes, unlike contrastive approaches, which focus on a single mode at a time. We achieve benchmark results on SYMSOL-I and T-Less datasets.

arxiv情報

著者 Shishir Reddy Vutukur,Rasmus Laurvig Haugaard,Junwen Huang,Benjamin Busam,Tolga Birdal
発行日 2024-09-10 17:51:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク