要約
最近の6次元物体姿勢推定に関する研究は、画像と物体モデル間のキーポイント対応を学習し、RANSACベースのアルゴリズム、またはエンドツーエンドの最適化により直接姿勢を回帰することにより、物体の姿勢を決定することに焦点を当てている。我々は、ポイントレベルの識別特徴の学習は、この文献では見落とされていると主張する。この目的のために、我々は完全畳み込み幾何学的特徴(FCGF)を再検討し、それをオブジェクトの6次元姿勢推定用に調整し、最先端の性能を達成する。FCGFは疎な畳み込みを採用し、最も難しいコントラスト損失を最適化することにより、完全畳み込みネットワークを用いて点レベルの特徴を学習する。我々は、損失と入力データ表現に重要な修正を採用し、学習戦略を注意深く調整し、基礎となる問題に適したデータ補強を採用することで、一般的なベンチマークにおいて最近の競合他社を凌駕することができる。各修正の寄与を調べるために、徹底的な解析を行っている。コードはhttps://github.com/jcorsetti/FCGF6D。
要約(オリジナル)
Recent works on 6D object pose estimation focus on learning keypoint correspondences between images and object models, and then determine the object pose through RANSAC-based algorithms or by directly regressing the pose with end-to-end optimisations. We argue that learning point-level discriminative features is overlooked in the literature. To this end, we revisit Fully Convolutional Geometric Features (FCGF) and tailor it for object 6D pose estimation to achieve state-of-the-art performance. FCGF employs sparse convolutions and learns point-level features using a fully-convolutional network by optimising a hardest contrastive loss. We can outperform recent competitors on popular benchmarks by adopting key modifications to the loss and to the input data representations, by carefully tuning the training strategies, and by employing data augmentations suitable for the underlying problem. We carry out a thorough ablation to study the contribution of each modification. The code is available at https://github.com/jcorsetti/FCGF6D.
arxiv情報
著者 | Jaime Corsetti,Davide Boscaini,Fabio Poiesi |
発行日 | 2023-10-03 10:30:26+00:00 |
arxivサイト | arxiv_id(pdf) |