Few-shot Scooping Under Domain Shift via Simulated Maximal Deployment Gaps

要約

地球外天体での自律着陸船ミッションでは、サンプリング戦略が地球上で広範囲に調整されている場合でも、ドメインのシフトに対処しながら粒状物質をサンプリングする必要があります。
この課題に取り組むために、この論文では、少数ショットスクーピング問題を研究し、新しいメタトレーニング戦略でトレーニングされたディープカーネルガウスプロセス手法を使用して、屋外での非常に限られた経験からオンラインで学習するビジョンベースの適応スクーピング戦略を提案します。
・配布対象地形。
当社の最大デプロイメント ギャップを使用したディープ カーネル キャリブレーション (kCMD) 戦略は、オフライン トレーニング データセットからシミュレートされた最大デプロイメント ギャップを作成し、トレーニング中にこれらのデプロイメント ギャップを克服するトレーニング モデルを作成することで、大きなドメインのシフトに適応するようにディープ カーネル モデルを明示的にトレーニングします。
ベイジアン最適化の逐次意思決定フレームワークで採用された提案手法により、ロボットは数回の試行後に分布外の地形で高品質のすくい動作を実行でき、発掘文献や発掘文献で提案されている非適応手法を大幅に上回ります。
その他の最先端のメタ学習メソッド。
提案された方法は、ゼロショット転送機能も実証しており、将来の可能性のある惑星ミッションのための最先端のシミュレーターとして機能する NASA OWLAT プラットフォームにうまく適応しています。
これらの結果は、大容量モデルでより一般化可能なメタ学習を実現するために、シミュレートされたデプロイメント ギャップを使用してディープ モデルをトレーニングできる可能性を示しています。
さらに、彼らは、着陸船が地球と地球外天体の間の展開ギャップを克服できるようにすることで、自律着陸船サンプリングミッションにおける私たちの方法の有望性を強調しています。

要約(オリジナル)

Autonomous lander missions on extraterrestrial bodies need to sample granular materials while coping with domain shifts, even when sampling strategies are extensively tuned on Earth. To tackle this challenge, this paper studies the few-shot scooping problem and proposes a vision-based adaptive scooping strategy that uses the deep kernel Gaussian process method trained with a novel meta-training strategy to learn online from very limited experience on out-of-distribution target terrains. Our Deep Kernel Calibration with Maximal Deployment Gaps (kCMD) strategy explicitly trains a deep kernel model to adapt to large domain shifts by creating simulated maximal deployment gaps from an offline training dataset and training models to overcome these deployment gaps during training. Employed in a Bayesian Optimization sequential decision-making framework, the proposed method allows the robot to perform high-quality scooping actions on out-of-distribution terrains after a few attempts, significantly outperforming non-adaptive methods proposed in the excavation literature as well as other state-of-the-art meta-learning methods. The proposed method also demonstrates zero-shot transfer capability, successfully adapting to the NASA OWLAT platform, which serves as a state-of-the-art simulator for potential future planetary missions. These results demonstrate the potential of training deep models with simulated deployment gaps for more generalizable meta-learning in high-capacity models. Furthermore, they highlight the promise of our method in autonomous lander sampling missions by enabling landers to overcome the deployment gap between Earth and extraterrestrial bodies.

arxiv情報

著者 Yifan Zhu,Pranay Thangeda,Erica L Tevere,Ashish Goel,Erik Kramer,Hari D Nayar,Melkior Ornik,Kris Hauser
発行日 2024-08-06 04:25:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY パーマリンク