要約
信頼性が高く効率的な軌道最適化手法は、自律動的システムにとって基本的なニーズであり、ロケットの着陸、極超音速再突入、宇宙船のランデブー、ドッキングなどのアプリケーションを効果的に可能にします。
このような安全性が重要なアプリケーション分野では、新たな軌道最適化問題の複雑さが、従来のアプローチのパフォーマンスを向上させるために AI ベースの技術を適用する動機となっています。
しかし、現在の AI ベースの手法は、従来の制御アルゴリズムを完全に置き換えようとするため、制約を満たす保証がなく、高価なシミュレーションが発生するか、教師あり学習によって従来の手法の動作のみを模倣することを目的としています。
これらの制限に対処するために、この論文では自律ランデブートランスフォーマー (ART) を提案し、予測と制御の両方の観点から、複雑な軌道最適化問題を解決する最新の生成モデルの機能を評価します。
具体的には、この研究では、(i) 以前に収集されたデータから最適に近いポリシーを学習し、(ii) 非凸最適制御問題を解決するための逐次オプティマイザをウォーム スタートして、ハード制約を満たすことを保証する Transformers の機能を評価します。
予測の観点から見ると、結果は、既知の燃料最適軌道の予測において ART が他の学習ベースのアーキテクチャよりも優れていることを強調しています。
制御の観点から見ると、実証分析は、Transformers を通じて学習したポリシーがどのようにして最適に近いウォーム スタートを生成し、(i) より燃料効率が高く、(ii) より少ない連続オプティマイザ反復で得られ、(iii) より優れた軌道を達成できるかを示しています。
凸最適化に基づくベンチマークと同等の全体的なランタイムで計算されます。
要約(オリジナル)
Reliable and efficient trajectory optimization methods are a fundamental need for autonomous dynamical systems, effectively enabling applications including rocket landing, hypersonic reentry, spacecraft rendezvous, and docking. Within such safety-critical application areas, the complexity of the emerging trajectory optimization problems has motivated the application of AI-based techniques to enhance the performance of traditional approaches. However, current AI-based methods either attempt to fully replace traditional control algorithms, thus lacking constraint satisfaction guarantees and incurring in expensive simulation, or aim to solely imitate the behavior of traditional methods via supervised learning. To address these limitations, this paper proposes the Autonomous Rendezvous Transformer (ART) and assesses the capability of modern generative models to solve complex trajectory optimization problems, both from a forecasting and control standpoint. Specifically, this work assesses the capabilities of Transformers to (i) learn near-optimal policies from previously collected data, and (ii) warm-start a sequential optimizer for the solution of non-convex optimal control problems, thus guaranteeing hard constraint satisfaction. From a forecasting perspective, results highlight how ART outperforms other learning-based architectures at predicting known fuel-optimal trajectories. From a control perspective, empirical analyses show how policies learned through Transformers are able to generate near-optimal warm-starts, achieving trajectories that are (i) more fuel-efficient, (ii) obtained in fewer sequential optimizer iterations, and (iii) computed with an overall runtime comparable to benchmarks based on convex optimization.
arxiv情報
著者 | Tommaso Guffanti,Daniele Gammelli,Simone D’Amico,Marco Pavone |
発行日 | 2023-12-06 18:06:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google