Domain Generalization for In-Orbit 6D Pose Estimation

要約

私たちは、単眼画像からターゲット宇宙船の相対的な 6D 姿勢、つまり位置と方向を推定するという問題に取り組みます。これは、将来の自律ランデブーおよび近接運用の重要な機能です。
実際の画像の大規模なセットを取得するのは難しいため、宇宙船の姿勢推定ネットワークは合成画像のみでトレーニングされます。
ただし、これらの画像は軌道上で遭遇する照明条件を捉えていないため、姿勢推定ネットワークはドメイン ギャップの問題に直面しています。つまり、これらの画像は実際の画像に一般化されません。
私たちの研究では、このドメインのギャップを埋める方法を導入しています。
これは、新しいエンドツーエンドのニューラルベースのアーキテクチャと新しい学習戦略に依存しています。
この戦略は、マルチタスク学習と積極的なデータ拡張ポリシーを通じてネットワークのドメイン汎化能力を向上させ、それによってネットワークがドメイン不変の特徴を学習するように強制します。
私たちは、私たちの方法がドメインのギャップを効果的に埋め、広範囲にわたる SPEED+ データセットで最先端の精度を達成することを実証します。
最後に、アブレーション研究では、私たちの方法の主要なコンポーネントが一般化能力に及ぼす影響を評価します。

要約(オリジナル)

We address the problem of estimating the relative 6D pose, i.e., position and orientation, of a target spacecraft, from a monocular image, a key capability for future autonomous Rendezvous and Proximity Operations. Due to the difficulty of acquiring large sets of real images, spacecraft pose estimation networks are exclusively trained on synthetic ones. However, because those images do not capture the illumination conditions encountered in orbit, pose estimation networks face a domain gap problem, i.e., they do not generalize to real images. Our work introduces a method that bridges this domain gap. It relies on a novel, end-to-end, neural-based architecture as well as a novel learning strategy. This strategy improves the domain generalization abilities of the network through multi-task learning and aggressive data augmentation policies, thereby enforcing the network to learn domain-invariant features. We demonstrate that our method effectively closes the domain gap, achieving state-of-the-art accuracy on the widespread SPEED+ dataset. Finally, ablation studies assess the impact of key components of our method on its generalization abilities.

arxiv情報

著者 Antoine Legrand,Renaud Detry,Christophe De Vleeschouwer
発行日 2024-06-17 17:01:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク