Goal-conditioned dual-action imitation learning for dexterous dual-arm robot manipulation

要約

バナナの皮をむくなど、変形可能な物体をロボットが長期にわたって器用に操作することは、物体モデリングの難しさと、安定した器用な操作スキルに関する知識の欠如のため、問題のある作業です。
この論文では、人間のデモンストレーション データを使用して器用な操作スキルを学習できる、目標条件付きデュアル アクション (GC-DA) 深層模倣学習 (DIL) アプローチを紹介します。
以前の DIL メソッドは、現在の感覚入力と反応アクションをマッピングしますが、アクションの反復計算によって引き起こされる模倣学習の複合エラーにより、失敗することがよくあります。
この方法では、ターゲット オブジェクトの精密な操作が必要な場合 (ローカル アクション) にのみリアクティブ アクションを予測し、精密な操作が必要でない場合 (グローバル アクション) に軌道全体を生成します。
このデュアルアクションの定式化は、反応的なローカルアクション中のターゲットオブジェクトの予期せぬ変化に応答しながら、軌道ベースのグローバルアクションを使用する模倣学習における複合エラーを効果的に防ぎます。
提案された方法は実際の双腕ロボットでテストされ、バナナの皮をむくタスクを正常に完了しました。

要約(オリジナル)

Long-horizon dexterous robot manipulation of deformable objects, such as banana peeling, is a problematic task because of the difficulties in object modeling and a lack of knowledge about stable and dexterous manipulation skills. This paper presents a goal-conditioned dual-action (GC-DA) deep imitation learning (DIL) approach that can learn dexterous manipulation skills using human demonstration data. Previous DIL methods map the current sensory input and reactive action, which often fails because of compounding errors in imitation learning caused by the recurrent computation of actions. The method predicts reactive action only when the precise manipulation of the target object is required (local action) and generates the entire trajectory when precise manipulation is not required (global action). This dual-action formulation effectively prevents compounding error in the imitation learning using the trajectory-based global action while responding to unexpected changes in the target object during the reactive local action. The proposed method was tested in a real dual-arm robot and successfully accomplished the banana-peeling task.

arxiv情報

著者 Heecheol Kim,Yoshiyuki Ohmura,Yasuo Kuniyoshi
発行日 2024-03-19 10:56:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク