Learning to bag with a simulation-free reinforcement learning framework for robots

要約

袋詰めは、人間が日常生活の中で行う必須のスキルです。
ただし、バッグなどの変形可能な物体はロボットにとって操作が複雑です。
この論文では、ロボットが袋詰めを学習できるようにする効率的な学習ベースのフレームワークを紹介します。
このフレームワークの新規性は、シミュレーションに依存せずにバギングを実行できることです。
この学習プロセスは、この研究で導入された強化学習アルゴリズムによって実現され、一連のコンパクトな状態表現に基づいてバッグの最適な把握ポイントを見つけるように設計されています。
このフレームワークは一連の基本アクションを利用し、タスクを 5 つの状態で表します。
私たちの実験では、フレームワークは、現実世界で約 3 時間のトレーニングを行った後、折りたたんだ状態と展開した状態から袋詰めタスクを開始した場合、それぞれ 60 % と 80 % の成功率に達しました。
最後に、サイズの異なるさらに 2 つのバッグを使用してトレーニング済みモデルをテストし、一般化可能性を評価します。

要約(オリジナル)

Bagging is an essential skill that humans perform in their daily activities. However, deformable objects, such as bags, are complex for robots to manipulate. This paper presents an efficient learning-based framework that enables robots to learn bagging. The novelty of this framework is its ability to perform bagging without relying on simulations. The learning process is accomplished through a reinforcement learning algorithm introduced in this work, designed to find the best grasping points of the bag based on a set of compact state representations. The framework utilizes a set of primitive actions and represents the task in five states. In our experiments, the framework reaches a 60 % and 80 % of success rate after around three hours of training in the real world when starting the bagging task from folded and unfolded, respectively. Finally, we test the trained model with two more bags of different sizes to evaluate its generalizability.

arxiv情報

著者 Francisco Munguia-Galeano,Jihong Zhu,Juan David Hernández,Ze Ji
発行日 2023-10-22 20:19:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク