C3DM: Constrained-Context Conditional Diffusion Models for Imitation Learning

要約

動作クローニング (BC) 手法は、複雑な操作タスクを学習するのに効果的です。
ただし、これらは偽の相関関係が発生する傾向があり、表現モデルはアクションの予測に無関係な注意をそらすものに焦点を当てている可能性があるため、現実世界の展開では脆弱です。
従来の方法では、さまざまなモデル アーキテクチャとアクション表現を検討することで、この課題に対処してきました。
しかし、複雑なアクション空間を伴う操作タスクを解決するために、サンプル効率とディストラクターに対する堅牢性のバランスをとることができたものはありませんでした。
我々は、6-DoF ロボット操作タスクを解決するための拡散モデル ポリシーである \textbf{C}onstrained-\textbf{C}ontext \textbf{C}onditional \textbf{D}iffusion \textbf{M}odel (C3DM) を紹介します。
わずか 5 回のデモン​​ストレーションから展開可能なロボット ポリシーを学習できる、気を散らすものに対する堅牢性。
C3DM の重要なコンポーネントは、アクション デノイザーがコンテキスト内の気を散らすものを無視しながら、予測された注視点の周囲のタスク関連領域に焦点を当てるのに役立つ注視ステップです。
私たちは、C3DM が配布外のディストラクタに対して堅牢であり、テーブル上の操作からディストラクタに対するさまざまなレベルの精度と堅牢性を必要とする産業用キッティングまで、幅広いタスクで一貫して高い成功率を達成することを経験的に示しています。

要約(オリジナル)

Behavior Cloning (BC) methods are effective at learning complex manipulation tasks. However, they are prone to spurious correlation – expressive models may focus on distractors that are irrelevant to action prediction – and are thus fragile in real-world deployment. Prior methods have addressed this challenge by exploring different model architectures and action representations. However, none were able to balance between sample efficiency and robustness against distractors for solving manipulation tasks with a complex action space. We present \textbf{C}onstrained-\textbf{C}ontext \textbf{C}onditional \textbf{D}iffusion \textbf{M}odel (C3DM), a diffusion model policy for solving 6-DoF robotic manipulation tasks with robustness to distractions that can learn deployable robot policies from as little as five demonstrations. A key component of C3DM is a fixation step that helps the action denoiser to focus on task-relevant regions around a predicted fixation point while ignoring distractors in the context. We empirically show that C3DM is robust to out-of-distribution distractors, and consistently achieves high success rates on a wide array of tasks, ranging from table-top manipulation to industrial kitting that require varying levels of precision and robustness to distractors.

arxiv情報

著者 Vaibhav Saxena,Yotto Koga,Danfei Xu
発行日 2024-08-27 17:45:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク