Goal-conditioned dual-action imitation learning for dexterous dual-arm robot manipulation

要約

バナナの剥離などの変形可能なオブジェクトの長距離器用ロボット操作は、オブジェクトモデリングの難しさと安定した器用な操作スキルに関する知識の欠如のため、問題のある作業です。
このペーパーでは、人間のデモデータを使用して器用な操作スキルを学ぶことができる目標条件付きデュアルアクション(GC-DA)ディープ模倣学習(DIL)アプローチを紹介します。
以前のDILメソッドは、現在の感覚入力と反応的アクションをマッピングします。これは、アクションの再発計算によって引き起こされる模倣学習の複利エラーのために失敗することがよくあります。
このメソッドは、ターゲットオブジェクトの正確な操作が必要な場合にのみ反応性アクションを予測し(ローカルアクション)、正確な操作が必要ない場合(グローバルアクション)、軌道全体を生成します。
このデュアルアクションの定式化は、リアクティブローカルアクション中にターゲットオブジェクトの予期しない変更に応答しながら、軌跡ベースのグローバルアクションを使用した模倣学習の複合エラーを効果的に防止します。
提案された方法は、実際のデュアルアームロボットでテストされ、バナナピールのタスクを正常に達成しました。
これと関連する作品のデータは、https://sites.google.com/view/multi-task-fineで入手できます。

要約(オリジナル)

Long-horizon dexterous robot manipulation of deformable objects, such as banana peeling, is a problematic task because of the difficulties in object modeling and a lack of knowledge about stable and dexterous manipulation skills. This paper presents a goal-conditioned dual-action (GC-DA) deep imitation learning (DIL) approach that can learn dexterous manipulation skills using human demonstration data. Previous DIL methods map the current sensory input and reactive action, which often fails because of compounding errors in imitation learning caused by the recurrent computation of actions. The method predicts reactive action only when the precise manipulation of the target object is required (local action) and generates the entire trajectory when precise manipulation is not required (global action). This dual-action formulation effectively prevents compounding error in the imitation learning using the trajectory-based global action while responding to unexpected changes in the target object during the reactive local action. The proposed method was tested in a real dual-arm robot and successfully accomplished the banana-peeling task. Data from this and related works are available at: https://sites.google.com/view/multi-task-fine.

arxiv情報

著者 Heecheol Kim,Yoshiyuki Ohmura,Yasuo Kuniyoshi
発行日 2025-05-21 23:12:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク