Diffusion Meets Options: Hierarchical Generative Skill Composition for Temporally-Extended Tasks

要約

ロボットを安全かつ成功裏に配備するには、複雑な計画を生成する能力だけでなく、頻繁に再計画を行い、実行エラーを修正する能力も必要である。本論文では、時間的に拡張された目標の下で、後退する水平線的な方法で、長期的な軌道計画という課題に取り組む。そのために、線形時間論理(LTL)で指定された命令に基づいて計画を生成・更新するデータ駆動型の階層的フレームワークであるDOPPLERを提案する。本手法は、オフラインの非専門家データセットからの階層的強化学習により、時間タスクを選択肢の連鎖に分解する。また、拡散モデルを活用して、低レベルのアクションを持つオプションを生成する。バッチ生成の際に、決定式に導かれた事後サンプリング技法を考案し、拡散により生成されるオプションの速度と多様性を向上させ、より効率的なクエリに導く。ロボットのナビゲーションと操作タスクの実験により、DOPPLERが障害物回避と連続的な訪問のための指定された公式を徐々に満たす軌道のシーケンスを生成できることを実証する。デモ動画はオンラインで入手可能: https://philiptheother.github.io/doppler/.

要約(オリジナル)

Safe and successful deployment of robots requires not only the ability to generate complex plans but also the capacity to frequently replan and correct execution errors. This paper addresses the challenge of long-horizon trajectory planning under temporally extended objectives in a receding horizon manner. To this end, we propose DOPPLER, a data-driven hierarchical framework that generates and updates plans based on instruction specified by linear temporal logic (LTL). Our method decomposes temporal tasks into chain of options with hierarchical reinforcement learning from offline non-expert datasets. It leverages diffusion models to generate options with low-level actions. We devise a determinantal-guided posterior sampling technique during batch generation, which improves the speed and diversity of diffusion generated options, leading to more efficient querying. Experiments on robot navigation and manipulation tasks demonstrate that DOPPLER can generate sequences of trajectories that progressively satisfy the specified formulae for obstacle avoidance and sequential visitation. Demonstration videos are available online at: https://philiptheother.github.io/doppler/.

arxiv情報

著者 Zeyu Feng,Hao Luan,Kevin Yuchen Ma,Harold Soh
発行日 2024-10-03 11:10:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク