Learning Robotic Manipulation Policies from Point Clouds with Conditional Flow Matching


ただし、模倣学習アルゴリズムには、入力モダリティ、トレーニング目的、6-DoF エンドエフェクターのポーズ表現に至るまで、多くの設計上の選択が必要です。
最近、条件付きフロー マッチング (CFM) (または整流フロー) が拡散モデルのより柔軟な一般化として提案されています。
この論文では、ロボット ポリシー学習のコンテキストにおける CFM の適用を調査し、特に模倣学習アルゴリズムの構築に必要な他の設計選択肢との相互作用を調査します。
CFM が点群入力観測と組み合わせると最高のパフォーマンスが得られることを示します。
さらに、SO(3) 多様体での CFM 定式化の実現可能性を研究し、簡略化された例でその適合性を評価します。
RLBench で広範な実験を実行し、提案した PointFlowMatch アプローチが 8 つのタスクにわたって 67.8% という最先端の平均成功率を達成し、これは次善の方法の 2 倍のパフォーマンスを達成することを実証しました。


Learning from expert demonstrations is a promising approach for training robotic manipulation policies from limited data. However, imitation learning algorithms require a number of design choices ranging from the input modality, training objective, and 6-DoF end-effector pose representation. Diffusion-based methods have gained popularity as they enable predicting long-horizon trajectories and handle multimodal action distributions. Recently, Conditional Flow Matching (CFM) (or Rectified Flow) has been proposed as a more flexible generalization of diffusion models. In this paper, we investigate the application of CFM in the context of robotic policy learning and specifically study the interplay with the other design choices required to build an imitation learning algorithm. We show that CFM gives the best performance when combined with point cloud input observations. Additionally, we study the feasibility of a CFM formulation on the SO(3) manifold and evaluate its suitability with a simplified example. We perform extensive experiments on RLBench which demonstrate that our proposed PointFlowMatch approach achieves a state-of-the-art average success rate of 67.8% over eight tasks, double the performance of the next best method.


著者 Eugenio Chisari,Nick Heppert,Max Argus,Tim Welschehold,Thomas Brox,Abhinav Valada
発行日 2024-09-11 15:25:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク