Revisiting Fully Convolutional Geometric Features for Object 6D Pose Estimation


6D オブジェクトの姿勢推定に関する最近の研究では、画像とオブジェクト モデルの間のキーポイントの対応関係を学習することに重点を置き、その後、RANSAC ベースのアルゴリズムを通じて、またはエンドツーエンドの最適化でポーズを直接回帰することによってオブジェクトの姿勢を決定します。
この目的を達成するために、完全畳み込み幾何特徴 (FCGF) を再検討し、オブジェクト 6D 姿勢推定に合わせて調整し、最先端のパフォーマンスを実現します。
FCGF はスパース畳み込みを採用し、最も困難なコントラスト損失を最適化することにより完全畳み込みネットワークを使用してポイントレベルの特徴を学習します。


Recent works on 6D object pose estimation focus on learning keypoint correspondences between images and object models, and then determine the object pose through RANSAC-based algorithms or by directly regressing the pose with end-to-end optimisations. We argue that learning point-level discriminative features is overlooked in the literature. To this end, we revisit Fully Convolutional Geometric Features (FCGF) and tailor it for object 6D pose estimation to achieve state-of-the-art performance. FCGF employs sparse convolutions and learns point-level features using a fully-convolutional network by optimising a hardest contrastive loss. We can outperform recent competitors on popular benchmarks by adopting key modifications to the loss and to the input data representations, by carefully tuning the training strategies, and by employing data augmentations suitable for the underlying problem. We carry out a thorough ablation to study the contribution of each modification.


著者 Jaime Corsetti,Davide Boscaini,Fabio Poiesi
発行日 2023-07-28 12:16:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク