要約
ロボットの視覚運動ポリシーを学習および合成するための新しいモデルであるリーマン流マッチング ポリシー (RFMP) を紹介します。
RFMP は、フロー マッチング手法の効率的なトレーニングおよび推論機能を活用します。
設計上、RFMP はフロー マッチングの長所、つまりロボット タスクでよく見られる高次元のマルチモーダル分布をエンコードする機能と、非常にシンプルで高速な推論プロセスを継承しています。
状態ベースと視覚条件付きの両方のロボット動作ポリシーへの RFMP の適用可能性を実証します。
特に、ロボットの状態はリーマン多様体上に存在するため、RFMP には本質的に幾何学的な認識が組み込まれており、これは現実的なロボット タスクに不可欠です。
RFMP を評価するために、2 つの概念実証実験を実施し、そのパフォーマンスを拡散ポリシーと比較しました。
どちらのアプローチも考慮されたタスクの学習に成功していますが、我々の結果は、RFMP の方が大幅に短い推論時間でよりスムーズなアクション軌跡を提供することを示しています。
要約(オリジナル)
We introduce Riemannian Flow Matching Policies (RFMP), a novel model for learning and synthesizing robot visuomotor policies. RFMP leverages the efficient training and inference capabilities of flow matching methods. By design, RFMP inherits the strengths of flow matching: the ability to encode high-dimensional multimodal distributions, commonly encountered in robotic tasks, and a very simple and fast inference process. We demonstrate the applicability of RFMP to both state-based and vision-conditioned robot motion policies. Notably, as the robot state resides on a Riemannian manifold, RFMP inherently incorporates geometric awareness, which is crucial for realistic robotic tasks. To evaluate RFMP, we conduct two proof-of-concept experiments, comparing its performance against Diffusion Policies. Although both approaches successfully learn the considered tasks, our results show that RFMP provides smoother action trajectories with significantly lower inference times.
arxiv情報
| 著者 | Max Braun,Noémie Jaquier,Leonel Rozo,Tamim Asfour | 
| 発行日 | 2024-08-27 11:13:43+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
