Fast Flow-based Visuomotor Policies via Conditional Optimal Transport Couplings

要約

拡散政策とフローマッチング政策は、マルチモーダルなロボットの軌道分布を正確に捉えることで、ロボットの応用において近年目覚ましい性能を発揮している。しかし、ODEやSDAEの数値積分による計算コストの高い推論は、ロボットのリアルタイムコントローラとしての適用を制限している。我々は、ロボットの行動生成タスクのためのフローODEにおいて、直線解を強制するために、ノイズとサンプルの間の条件付き最適輸送結合を利用する方法論を紹介する。ノイズとサンプルの素朴な結合は条件付きタスクでは失敗することを示し、結合プロセスに条件変数を組み込んで少数ステップ性能を改善することを提案する。提案する少数ステップ政策は、多様なシミュレーションタスクの集合において、拡散政策と比較して10倍のスピードアップで4%高い成功率を達成する。さらに、実世界のロボットタスクのセットにおいて、1-2ステップで高品質で多様な行動軌道を生成する。また、本手法は、蒸留ベースのアプローチとは対照的に、拡散ポリシーやバニラフローマッチングと同じ学習複雑度を保持している。

要約(オリジナル)

Diffusion and flow matching policies have recently demonstrated remarkable performance in robotic applications by accurately capturing multimodal robot trajectory distributions. However, their computationally expensive inference, due to the numerical integration of an ODE or SDE, limits their applicability as real-time controllers for robots. We introduce a methodology that utilizes conditional Optimal Transport couplings between noise and samples to enforce straight solutions in the flow ODE for robot action generation tasks. We show that naively coupling noise and samples fails in conditional tasks and propose incorporating condition variables into the coupling process to improve few-step performance. The proposed few-step policy achieves a 4% higher success rate with a 10x speed-up compared to Diffusion Policy on a diverse set of simulation tasks. Moreover, it produces high-quality and diverse action trajectories within 1-2 steps on a set of real-world robot tasks. Our method also retains the same training complexity as Diffusion Policy and vanilla Flow Matching, in contrast to distillation-based approaches.

arxiv情報

著者 Andreas Sochopoulos,Nikolay Malkin,Nikolaos Tsagkas,João Moura,Michael Gienger,Sethu Vijayakumar
発行日 2025-05-02 10:47:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク