Uncertainty-driven Exploration Strategies for Online Grasp Learning

要約

既存の把握予測アプローチは主にオフライン学習に基づいており、新しいピッキング シナリオ、つまり目に見えないオブジェクトやドメイン外 (OOD) のオブジェクト、カメラやビンの設定などにオンラインで適応する際の探索的な把握学習は無視されています。
この論文では、ロボットによるビンピッキングの把握予測をオンラインで学習するための不確実性ベースのアプローチを紹介します。
具体的には、効果的な探索戦略を備えたオンライン学習アルゴリズムにより、目に見えない環境設定への適応パフォーマンスを大幅に向上させることができます。
この目的を達成するために、まずオンライン把握学習を RL 問題として定式化し、把握報酬予測と把握ポーズの両方を適応させることを提案します。
ベイジアン不確実性定量化と分布アンサンブルに基づいたさまざまな不確実性推定スキームを提案します。
さまざまな難易度の実際のビンピッキングシーンで評価を実施します。
ビン内の物体は、半透明または完全透明、不規則または曲面などによって特徴づけられる、さまざまな困難な物理的および知覚的特性を持っています。
私たちの実験結果は、単純な探索戦略のみを組み込んだ従来のオンライン学習方法と比較して、把握パフォーマンスが顕著に向上していることを示しています。
ビデオ: https://youtu.be/fPKOrjC2QrU

要約(オリジナル)

Existing grasp prediction approaches are mostly based on offline learning, while, ignoring the exploratory grasp learning during online adaptation to new picking scenarios, i.e., objects that are unseen or out-of-domain (OOD), camera and bin settings, etc. In this paper, we present an uncertainty-based approach for online learning of grasp predictions for robotic bin picking. Specifically, the online learning algorithm with an effective exploration strategy can significantly improve its adaptation performance to unseen environment settings. To this end, we first propose to formulate online grasp learning as an RL problem that will allow us to adapt both grasp reward prediction and grasp poses. We propose various uncertainty estimation schemes based on Bayesian uncertainty quantification and distributional ensembles. We carry out evaluations on real-world bin picking scenes of varying difficulty. The objects in the bin have various challenging physical and perceptual characteristics that can be characterized by semi- or total transparency, and irregular or curved surfaces. The results of our experiments demonstrate a notable improvement of grasp performance in comparison to conventional online learning methods which incorporate only naive exploration strategies. Video: https://youtu.be/fPKOrjC2QrU

arxiv情報

著者 Yitian Shi,Philipp Schillinger,Miroslav Gabriel,Alexander Qualmann,Zohar Feldman,Hanna Ziesche,Ngo Anh Vien
発行日 2024-04-24 11:40:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク