SoftGPT: Learn Goal-oriented Soft Object Manipulation Skills by Generative Pre-trained Heterogeneous Graph Transformer

要約

家庭内シーンにおけるソフトオブジェクトの操作タスクは、その複雑な力学と可変形状の特性により、既存のロボットスキル学習技術に大きな課題をもたらします。
人間のデモンストレーションから新しい操作スキルを学習することはロボットの応用に効果的な方法であるため、柔らかいオブジェクトの表現とダイナミクスについての事前知識を開発することが必要です。
この点に関して、我々は、事前にトレーニングされたソフトオブジェクト操作スキル学習モデル、つまりSoftGPTを提案します。これは、3次元異種グラフ表現とGPTベースのダイナミクスモデルで構成される、大量の探索データを使用してトレーニングされます。
下流タスクごとに、目標指向のポリシー エージェントが後続のアクションを予測するようにトレーニングされ、SoftGPT がこれらのアクションの結果を生成します。
これら 2 つのアプローチを統合すると、ロボットの心の中に思考プロセスが確立され、ポリシーの学習を促進するための展開が提供されます。
私たちの結果は、この思考プロセスを通じて事前知識を活用することで、さまざまなソフトオブジェクト操作スキルを効率的に学習でき、人間のデモンストレーションから直接学習できる可能性があることを示しています。

要約(オリジナル)

Soft object manipulation tasks in domestic scenes pose a significant challenge for existing robotic skill learning techniques due to their complex dynamics and variable shape characteristics. Since learning new manipulation skills from human demonstration is an effective way for robot applications, developing prior knowledge of the representation and dynamics of soft objects is necessary. In this regard, we propose a pre-trained soft object manipulation skill learning model, namely SoftGPT, that is trained using large amounts of exploration data, consisting of a three-dimensional heterogeneous graph representation and a GPT-based dynamics model. For each downstream task, a goal-oriented policy agent is trained to predict the subsequent actions, and SoftGPT generates the consequences of these actions. Integrating these two approaches establishes a thinking process in the robot’s mind that provides rollout for facilitating policy learning. Our results demonstrate that leveraging prior knowledge through this thinking process can efficiently learn various soft object manipulation skills, with the potential for direct learning from human demonstrations.

arxiv情報

著者 Junjia Liu,Zhihao Li,Sylvain Calinon,Fei Chen
発行日 2023-06-22 05:48:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク