Exploring Pose-Guided Imitation Learning for Robotic Precise Insertion

要約

最近の研究は、模倣学習がロボット操作の分野で強い可能性を示すことを証明しています。
ただし、既存の方法は依然として精密操作タスクに苦労しており、非効率的な画像/ポイントクラウド観測に依存しています。
この論文では、SE(3)オブジェクトのポーズを模倣学習に紹介し、ロボットの正確な挿入タスクのポーズガイド付き効率的な模倣学習方法を提案します。
まず、相対的なSE(3)ポーズを観測アクションペアとして利用する正確な挿入拡散ポリシーを提案します。
ポリシーは、ソースオブジェクトSE(3)がターゲットオブジェクトを比較して軌跡をポーズにすることをモデル化します。
第二に、RGBDデータをポーズガイド付き拡散ポリシーに導入することを探ります。
具体的には、現在の状態と目標状態の間の矛盾をキャプチャするために、目標調整されたRGBDエンコーダーを設計します。
さらに、ポーズガイド付きの残留ゲート融合法が提案されています。これは、バックボーンとしてポーズ機能を取り、RGBD機能は適応ゲーティングメカニズムを介してポーズ機能の欠陥を選択的に補正します。
私たちの方法は、6つのロボットの正確な挿入タスクで評価され、7〜10のデモンストレーションで競争力のあるパフォーマンスを実証します。
実験は、提案された方法が約0.01 mmのクリアランスで精密挿入タスクを正常に完了できることを示しています。
実験結果は、既存のベースラインと比較して、その優れた効率と一般化能力を強調しています。
コードはhttps://github.com/sunhan1997/poseinsertで入手できます。

要約(オリジナル)

Recent studies have proved that imitation learning shows strong potential in the field of robotic manipulation. However, existing methods still struggle with precision manipulation task and rely on inefficient image/point cloud observations. In this paper, we explore to introduce SE(3) object pose into imitation learning and propose the pose-guided efficient imitation learning methods for robotic precise insertion task. First, we propose a precise insertion diffusion policy which utilizes the relative SE(3) pose as the observation-action pair. The policy models the source object SE(3) pose trajectory relative to the target object. Second, we explore to introduce the RGBD data to the pose-guided diffusion policy. Specifically, we design a goal-conditioned RGBD encoder to capture the discrepancy between the current state and the goal state. In addition, a pose-guided residual gated fusion method is proposed, which takes pose features as the backbone, and the RGBD features selectively compensate for pose feature deficiencies through an adaptive gating mechanism. Our methods are evaluated on 6 robotic precise insertion tasks, demonstrating competitive performance with only 7-10 demonstrations. Experiments demonstrate that the proposed methods can successfully complete precision insertion tasks with a clearance of about 0.01 mm. Experimental results highlight its superior efficiency and generalization capability compared to existing baselines. Code will be available at https://github.com/sunhan1997/PoseInsert.

arxiv情報

著者 Han Sun,Yizhao Wang,Zhenning Zhou,Shuai Wang,Haibo Yang,Jingyuan Sun,Qixin Cao
発行日 2025-05-14 14:25:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク