要約
我々は、エージェント間でばらつきがあるロボット群など、偶発的な不確実性を持つシステムに対するデータ駆動型制御手法を提案します。
私たちの方法では、共有軌道データを活用して設計されたコントローラーの堅牢性を高め、事前のパラメーターや不確実性の推定を必要とせずに新しいバリエーションへの移行を容易にします。
パフォーマンスのための経験の伝達に関する既存の研究とは対照的に、私たちのアプローチは堅牢性に焦点を当てており、複数の実現から収集されたデータを使用して、目に見えないものへの一般化を保証します。
私たちの手法は、直接的なデータ駆動型制御のための最近の定式化と組み合わせたシナリオの最適化に基づいています。
偶然の不確実性を伴う確率システムの二次安定性を達成するために必要なデータ量の下限を導出し、数値例を通じてデータ駆動型手法の利点を実証します。
学習されたコントローラーは、少数の短い開ループ軌道のみに基づいている場合でも、ダイナミクスの大きな変動をよく一般化することがわかりました。
堅牢なエクスペリエンス転送により、展開中に追加の学習を必要とせずに、すぐに使用できる安全で堅牢なコントローラーの設計が可能になります。
要約(オリジナル)
We propose a data-driven control method for systems with aleatoric uncertainty, for example, robot fleets with variations between agents. Our method leverages shared trajectory data to increase the robustness of the designed controller and thus facilitate transfer to new variations without the need for prior parameter and uncertainty estimations. In contrast to existing work on experience transfer for performance, our approach focuses on robustness and uses data collected from multiple realizations to guarantee generalization to unseen ones. Our method is based on scenario optimization combined with recent formulations for direct data-driven control. We derive lower bounds on the amount of data required to achieve quadratic stability for probabilistic systems with aleatoric uncertainty and demonstrate the benefits of our data-driven method through a numerical example. We find that the learned controllers generalize well to high variations in the dynamics even when based on only a few short open-loop trajectories. Robust experience transfer enables the design of safe and robust controllers that work out of the box without any additional learning during deployment.
arxiv情報
著者 | Alexander von Rohr,Dmitrii Likhachev,Sebastian Trimpe |
発行日 | 2024-03-22 10:27:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google