CGD: Constraint-Guided Diffusion Policies for UAV Trajectory Planning

要約

従来の最適化ベースのプランナーは、効果的ではあるが、計算コストが高く、その結果、軌道生成に時間がかかるという問題を抱えている。計算時間を短縮するための成功戦略は、模倣学習(IL)を用いて、専門家のデモンストレーターとして扱われるプランナーから高速なニューラルネットワーク(NN)ポリシーを開発することである。結果として得られるNN政策は、エキスパートから得られるものと同様の軌道を素早く生成するのに有効であるが、(1)その出力は動的実現可能性を明示的に考慮していない。 これらの限界を克服するために、我々は、ILに基づく新しい軌道計画アプローチであるConstraint-Guided Diffusion (CGD)を提案する。CGDは、ハイブリッド学習/オンライン最適化スキームを活用し、拡散ポリシーとサロゲート効率的最適化問題を組み合わせることで、衝突のない、動的に実行可能な軌道の生成を可能にする。CGDの主なアイデアには、エキスパートが解く元の困難な最適化問題を、より管理しやすい2つのサブ問題に分割することが含まれる:(a)衝突のない経路を効率的に見つけること、(b)軌道を得るために、それらの経路のための動的に実現可能な時間パラメトリゼーションを決定すること。従来のニューラルネットワークアーキテクチャと比較して、訓練中に遭遇したことのない新たな制約条件を持つシナリオにおいて、性能と動的実現可能性が大幅に改善されたことを数値評価により実証する。

要約(オリジナル)

Traditional optimization-based planners, while effective, suffer from high computational costs, resulting in slow trajectory generation. A successful strategy to reduce computation time involves using Imitation Learning (IL) to develop fast neural network (NN) policies from those planners, which are treated as expert demonstrators. Although the resulting NN policies are effective at quickly generating trajectories similar to those from the expert, (1) their output does not explicitly account for dynamic feasibility, and (2) the policies do not accommodate changes in the constraints different from those used during training. To overcome these limitations, we propose Constraint-Guided Diffusion (CGD), a novel IL-based approach to trajectory planning. CGD leverages a hybrid learning/online optimization scheme that combines diffusion policies with a surrogate efficient optimization problem, enabling the generation of collision-free, dynamically feasible trajectories. The key ideas of CGD include dividing the original challenging optimization problem solved by the expert into two more manageable sub-problems: (a) efficiently finding collision-free paths, and (b) determining a dynamically-feasible time-parametrization for those paths to obtain a trajectory. Compared to conventional neural network architectures, we demonstrate through numerical evaluations significant improvements in performance and dynamic feasibility under scenarios with new constraints never encountered during training.

arxiv情報

著者 Kota Kondo,Andrea Tagliabue,Xiaoyi Cai,Claudius Tewari,Olivia Garcia,Marcos Espitia-Alvarez,Jonathan P. How
発行日 2024-05-02 21:50:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク