Revisiting Fully Convolutional Geometric Features for Object 6D Pose Estimation

要約

6D オブジェクトの姿勢推定に関する最近の研究では、画像とオブジェクト モデルの間のキーポイントの対応関係を学習することに重点を置き、その後、RANSAC ベースのアルゴリズムを通じて、またはエンドツーエンドの最適化でポーズを直接回帰することによってオブジェクトの姿勢を決定します。
私たちは、ポイントレベルの識別特徴の学習が文献では見落とされていると主張します。
この目的を達成するために、完全畳み込み幾何特徴 (FCGF) を再検討し、オブジェクト 6D 姿勢推定に合わせて調整し、最先端のパフォーマンスを実現します。
FCGF はスパース畳み込みを採用し、最も困難なコントラスト損失を最適化することにより完全畳み込みネットワークを使用してポイントレベルの特徴を学習します。
当社は、損失と入力データ表現に重要な変更を加え、トレーニング戦略を慎重に調整し、根本的な問題に適したデータ拡張を採用することで、人気のベンチマークで最近の競合他社を上回るパフォーマンスを発揮できます。
私たちは徹底的なアブレーションを実行して、各修正の寄与を研究します。

要約(オリジナル)

Recent works on 6D object pose estimation focus on learning keypoint correspondences between images and object models, and then determine the object pose through RANSAC-based algorithms or by directly regressing the pose with end-to-end optimisations. We argue that learning point-level discriminative features is overlooked in the literature. To this end, we revisit Fully Convolutional Geometric Features (FCGF) and tailor it for object 6D pose estimation to achieve state-of-the-art performance. FCGF employs sparse convolutions and learns point-level features using a fully-convolutional network by optimising a hardest contrastive loss. We can outperform recent competitors on popular benchmarks by adopting key modifications to the loss and to the input data representations, by carefully tuning the training strategies, and by employing data augmentations suitable for the underlying problem. We carry out a thorough ablation to study the contribution of each modification.

arxiv情報

著者 Jaime Corsetti,Davide Boscaini,Fabio Poiesi
発行日 2023-07-28 12:16:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク