要約
拡散ポリシーは、マルチモーダルアクション分布をキャプチャする能力のために、複雑な視覚運動タスクで広く採用されています。
ただし、アクション生成に必要な複数のサンプリングステップは、リアルタイムの推論効率を大きく損なうため、リアルタイムの意思決定シナリオでの適用性が制限されます。
既存の加速手法では、低いサンプリングステップの下で再訓練または劣化性能を必要とします。
ここでは、この速度パフォーマンスのトレードオフを軽減し、さらなる加速を達成するFalconを提案します。
中心的な洞察は、視覚運動タスクがアクション間で連続的な依存関係を示すことです。
ファルコンは、各ステップでガウスノイズからサンプリングするのではなく、履歴情報から部分的に除去されたアクションを再利用することにより、これを活用します。
現在の観測を統合することにより、ファルコンはパフォーマンスを維持しながらサンプリングステップを削減します。
重要なことに、Falconはプラグインとして適用できるトレーニングなしのアルゴリズムであり、既存の加速技術に加えて決定効率をさらに向上させることができます。
48のシミュレートされた環境と2つの実際のロボット実験でFalconを検証しました。
パフォーマンスの低下を伴う2〜7倍のスピードアップを実証し、効率的な視覚運動ポリシー設計のための有望な方向性を提供します。
要約(オリジナル)
Diffusion policies are widely adopted in complex visuomotor tasks for their ability to capture multimodal action distributions. However, the multiple sampling steps required for action generation significantly harm real-time inference efficiency, which limits their applicability in real-time decision-making scenarios. Existing acceleration techniques either require retraining or degrade performance under low sampling steps. Here we propose Falcon, which mitigates this speed-performance trade-off and achieves further acceleration. The core insight is that visuomotor tasks exhibit sequential dependencies between actions. Falcon leverages this by reusing partially denoised actions from historical information rather than sampling from Gaussian noise at each step. By integrating current observations, Falcon reduces sampling steps while preserving performance. Importantly, Falcon is a training-free algorithm that can be applied as a plug-in to further improve decision efficiency on top of existing acceleration techniques. We validated Falcon in 48 simulated environments and 2 real-world robot experiments. demonstrating a 2-7x speedup with negligible performance degradation, offering a promising direction for efficient visuomotor policy design.
arxiv情報
著者 | Haojun Chen,Minghao Liu,Chengdong Ma,Xiaojian Ma,Zailin Ma,Huimin Wu,Yuanpei Chen,Yifan Zhong,Mingzhi Wang,Qing Li,Yaodong Yang |
発行日 | 2025-05-31 18:44:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google