Uncertainty-driven Exploration Strategies for Online Grasp Learning

要約

既存の把握予測アプローチは主にオフライン学習に基づいていますが、新しいピッキング シナリオ、つまり目に見えないオブジェクト ポートフォリオ、カメラとビンの設定などにオンラインで適応する際の探索的な把握学習は無視されています。この論文では、オンライン学習のための新しい方法を紹介します。
原理的な方法でロボットによるビンピッキングの把握予測を実現します。
既存の把握予測アプローチは主にオフライン学習に基づいていますが、新しいピッキング シナリオ、つまり目に見えないオブジェクト ポートフォリオ、カメラとビンの設定などにオンラインで適応する際の探索的な把握学習は無視されています。この論文では、オンライン学習のための新しい方法を紹介します。
原理的な方法でロボットによるビンピッキングの把握予測を実現します。
具体的には、効果的な探索戦略を備えたオンライン学習アルゴリズムにより、目に見えない環境設定への適応パフォーマンスを大幅に向上させることができます。
この目的を達成するために、まずオンライン把握学習を RL 問題として定式化し、把握報酬予測と把握ポーズの両方を適応させることを提案します。
ベイズ不確実性定量化と分布アンサンブルに基づいたさまざまな不確実性推定スキームを提案します。
さまざまな難易度の実際のビンピッキングシーンで評価を実施します。
ビン内の物体は、半透明または完全透明、不規則または曲面などによって特徴づけられる、さまざまな困難な物理的および知覚的特性を持っています。
私たちの実験の結果は、単純な探索戦略のみを組み込んだ従来のオンライン学習方法と比較して、提案されたアプローチの顕著な改善を示しています。

要約(オリジナル)

Existing grasp prediction approaches are mostly based on offline learning, while, ignored the exploratory grasp learning during online adaptation to new picking scenarios, i.e., unseen object portfolio, camera and bin settings etc. In this paper, we present a novel method for online learning of grasp predictions for robotic bin picking in a principled way. Existing grasp prediction approaches are mostly based on offline learning, while, ignored the exploratory grasp learning during online adaptation to new picking scenarios, i.e., unseen object portfolio, camera and bin settings etc. In this paper, we present a novel method for online learning of grasp predictions for robotic bin picking in a principled way. Specifically, the online learning algorithm with an effective exploration strategy can significantly improve its adaptation performance to unseen environment settings. To this end, we first propose to formulate online grasp learning as a RL problem that will allow to adapt both grasp reward prediction and grasp poses. We propose various uncertainty estimation schemes based on Bayesian Uncertainty Quantification and Distributional Ensembles. We carry out evaluations on real-world bin picking scenes of varying difficulty. The objects in the bin have various challenging physical and perceptual characteristics that can be characterized by semi- or total transparency, and irregular or curved surfaces. The results of our experiments demonstrate a notable improvement in the suggested approach compared to conventional online learning methods which incorporate only naive exploration strategies.

arxiv情報

著者 Yitian Shi,Philipp Schillinger,Miroslav Gabriel,Alexander Kuss,Zohar Feldman,Hanna Ziesche,Ngo Anh Vien
発行日 2023-09-21 13:06:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク