要約
ロボットの意思決定において、長ホライズンプランニングのための効果的な軌道ステッチは重要な課題である。拡散モデルはプランニングにおいて有望であるが、学習データに見られるようなタスクの解決に限定される。我々はCompDiffuserを提案する。CompDiffuserは、以前に見たタスクから短い軌跡チャンクを構成的につなぎ合わせて学習することで、新しいタスクを解決することができる新しい生成的アプローチである。我々の重要な洞察は、重複するチャンクに細分化することで軌跡分布をモデル化し、単一の双方向拡散モデルを通してそれらの条件関係を学習することである。これにより、生成中にセグメント間で情報が伝播し、物理的に一貫した接続が保証される。我々は、環境サイズ、エージェントの状態次元、軌跡の種類、学習データの品質が異なる様々な難易度のベンチマークタスクで実験を行い、CompDiffuserが既存の手法を大幅に上回ることを示す。
要約(オリジナル)
Effective trajectory stitching for long-horizon planning is a significant challenge in robotic decision-making. While diffusion models have shown promise in planning, they are limited to solving tasks similar to those seen in their training data. We propose CompDiffuser, a novel generative approach that can solve new tasks by learning to compositionally stitch together shorter trajectory chunks from previously seen tasks. Our key insight is modeling the trajectory distribution by subdividing it into overlapping chunks and learning their conditional relationships through a single bidirectional diffusion model. This allows information to propagate between segments during generation, ensuring physically consistent connections. We conduct experiments on benchmark tasks of various difficulties, covering different environment sizes, agent state dimension, trajectory types, training data quality, and show that CompDiffuser significantly outperforms existing methods.
arxiv情報
著者 | Yunhao Luo,Utkarsh A. Mishra,Yilun Du,Danfei Xu |
発行日 | 2025-05-05 16:26:30+00:00 |
arxivサイト | arxiv_id(pdf) |