要約
このペーパーは、拡張可能な長期の長期計画対象のエージェントである新しい問題に取り組んでおり、エラーを複利なしでトレーニングデータの軌跡よりも長く計画しています。
これに取り組むために、短いものを縫うことでより長い軌道を繰り返し生成する増強方法である階層的マルチスケールディフューザー(HMディフューザー)とプログレッシブ軌道拡張(PTE)を提案します。
HM-Diffuserは、階層構造を使用してこれらの拡張された軌跡を訓練し、複数の時間スケールでタスクを効率的に処理します。
さらに、階層層を単一のモデルに統合して時間的スケールを再帰的に処理する適応計画と再帰的なHMディフューザーを導入します。
実験結果は、私たちのアプローチの有効性を示しており、スケーラブルな長期計画のために拡散ベースのプランナーを進めています。
要約(オリジナル)
This paper tackles a novel problem, extendable long-horizon planning-enabling agents to plan trajectories longer than those in training data without compounding errors. To tackle this, we propose the Hierarchical Multiscale Diffuser (HM-Diffuser) and Progressive Trajectory Extension (PTE), an augmentation method that iteratively generates longer trajectories by stitching shorter ones. HM-Diffuser trains on these extended trajectories using a hierarchical structure, efficiently handling tasks across multiple temporal scales. Additionally, we introduce Adaptive Plan Pondering and the Recursive HM-Diffuser, which consolidate hierarchical layers into a single model to process temporal scales recursively. Experimental results demonstrate the effectiveness of our approach, advancing diffusion-based planners for scalable long-horizon planning.
arxiv情報
著者 | Chang Chen,Hany Hamed,Doojin Baek,Taegu Kang,Yoshua Bengio,Sungjin Ahn |
発行日 | 2025-03-25 22:52:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google