Constrained-Context Conditional Diffusion Models for Imitation Learning

要約

オフライン模倣学習 (IL) は、特に高精度の操作タスクの視覚運動スキルを学習するための強力なパラダイムです。
ただし、IL 手法は誤った相関が発生する傾向があり、表現モデルはアクションの予測に無関係な注意をそらす要因に焦点を当てる可能性があるため、現実世界の展開では脆弱です。
従来の方法では、さまざまなモデル アーキテクチャとアクション表現を検討することで、この課題に対処してきました。
しかし、サンプル効率、邪魔者に対する堅牢性、および複雑なアクション空間を使用した高精度操作タスクの解決の間でバランスをとることができたものはありませんでした。
この目的のために、$\textbf{C}$onstrained-$\textbf{C}$ontext $\textbf{C}$onditional $\textbf{D}$iffusion $\textbf{M}$odel (C3DM) を提案します。
、6-DoF ロボット操作タスクを高精度で解決し、気を散らすものを無視する機能を実現するための拡散モデル ポリシー。
C3DM の重要なコンポーネントは、コンテキスト内の気を散らすものを無視しながら、アクション デノイザーが予測されたアクションの周囲のタスク関連領域に焦点を当てるのに役立つ固定ステップです。
私たちは、C3DM が、テーブル上での操作から産業用キッティングまで、さまざまなレベルの精度と気を散らすものに対する堅牢性を必要とする幅広いタスクで一貫して高い成功率を達成できることを経験的に示しています。
詳細については、https://sites.google.com/view/c3dm-imitation-learning をご覧ください。

要約(オリジナル)

Offline Imitation Learning (IL) is a powerful paradigm to learn visuomotor skills, especially for high-precision manipulation tasks. However, IL methods are prone to spurious correlation – expressive models may focus on distractors that are irrelevant to action prediction – and are thus fragile in real-world deployment. Prior methods have addressed this challenge by exploring different model architectures and action representations. However, none were able to balance between sample efficiency, robustness against distractors, and solving high-precision manipulation tasks with complex action space. To this end, we present $\textbf{C}$onstrained-$\textbf{C}$ontext $\textbf{C}$onditional $\textbf{D}$iffusion $\textbf{M}$odel (C3DM), a diffusion model policy for solving 6-DoF robotic manipulation tasks with high precision and ability to ignore distractions. A key component of C3DM is a fixation step that helps the action denoiser to focus on task-relevant regions around the predicted action while ignoring distractors in the context. We empirically show that C3DM is able to consistently achieve high success rate on a wide array of tasks, ranging from table top manipulation to industrial kitting, that require varying levels of precision and robustness to distractors. For details, please visit this https://sites.google.com/view/c3dm-imitation-learning

arxiv情報

著者 Vaibhav Saxena,Yotto Koga,Danfei Xu
発行日 2023-11-02 17:33:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク