要約
学習ベースの制御では、データを使用して特定のシステム用の効率的なコントローラーを設計します。
複数のシステムが関係する場合、エクスペリエンス転送では通常、データの可用性とコントローラーのパフォーマンスに焦点が当てられますが、システム間の変動に対する堅牢性は無視されます。
対照的に、この手紙では、堅牢性の観点から経験の伝達を検討します。
私たちはこの転送を利用して、個々のエージェントのモデルに関する不確実性だけでなく、フリート内のエージェントの選択にも強いコントローラーを設計します。
経験の移転により、異種フリート内のすべてのシステムですぐに使用できる、安全で堅牢なコントローラーの設計が可能になります。
私たちのアプローチは、システムのモデルを推定したり、そのパラメーターの不確実性限界を決定したりする必要がなく、シナリオの最適化と直接データ駆動制御のための最新の定式化を組み合わせたものです。
数値ケーススタディを通じてデータ駆動型ロバスト化手法の利点を実証し、クアッドコプター シミュレーションで少数の開ループ軌道から適切に一般化する学習済みコントローラーを取得します。
要約(オリジナル)
Learning-based control uses data to design efficient controllers for specific systems. When multiple systems are involved, experience transfer usually focuses on data availability and controller performance yet neglects robustness to variations between systems. In contrast, this letter explores experience transfer from a robustness perspective. We leverage the transfer to design controllers that are robust not only to the uncertainty regarding an individual agent’s model but also to the choice of agent in a fleet. Experience transfer enables the design of safe and robust controllers that work out of the box for all systems in a heterogeneous fleet. Our approach combines scenario optimization and recent formulations for direct data-driven control without the need to estimate a model of the system or determine uncertainty bounds for its parameters. We demonstrate the benefits of our data-driven robustification method through a numerical case study and obtain learned controllers that generalize well from a small number of open-loop trajectories in a quadcopter simulation.
arxiv情報
著者 | Alexander von Rohr,Dmitrii Likhachev,Sebastian Trimpe |
発行日 | 2023-06-29 14:28:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google