要約
一般的な把握予測方法は主にオフライン学習に依存しており、新しいピッキング シナリオにリアルタイムで適応する際に発生する動的な把握学習は無視されています。
これらのシナリオには、以前は見えなかったオブジェクト、カメラの視点の変化、ビンの構成などの要因が含まれる場合があります。
この論文では、オンライン把握学習のために半教師あり学習と強化学習を組み合わせた新しいアプローチである SSL-ConvSAC を紹介します。
報酬フィードバックを持つピクセルをラベル付きデータとして扱い、その他のピクセルをラベルなしとして扱うことで、ラベルなしデータを効率的に利用して学習を強化します。
さらに、状況に応じたカリキュラムベースの方法を提案することで、ラベル付きデータとラベルなしデータの不均衡に対処します。
私たちは、現実世界の評価データに基づいて提案されたアプローチを適用し、吸引グリッパーを備えた物理的な 7-DoF Franka Emika ロボット アームを使用した、ビンピッキングタスクでのオンライン把握学習の改善の可能性を実証します。
動画: https://youtu.be/OAro5pg8I9U
要約(オリジナル)
The prevailing grasp prediction methods predominantly rely on offline learning, overlooking the dynamic grasp learning that occurs during real-time adaptation to novel picking scenarios. These scenarios may involve previously unseen objects, variations in camera perspectives, and bin configurations, among other factors. In this paper, we introduce a novel approach, SSL-ConvSAC, that combines semi-supervised learning and reinforcement learning for online grasp learning. By treating pixels with reward feedback as labeled data and others as unlabeled, it efficiently exploits unlabeled data to enhance learning. In addition, we address the imbalance between labeled and unlabeled data by proposing a contextual curriculum-based method. We ablate the proposed approach on real-world evaluation data and demonstrate promise for improving online grasp learning on bin picking tasks using a physical 7-DoF Franka Emika robot arm with a suction gripper. Video: https://youtu.be/OAro5pg8I9U
arxiv情報
著者 | Huy Le,Philipp Schillinger,Miroslav Gabriel,Alexander Qualmann,Ngo Anh Vien |
発行日 | 2024-03-04 21:41:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google