要約
この研究では、自動運転 (AD) モジュールをあるドメインから別のドメイン、特にシミュレーションから現実世界 (Sim2Real) に転送する問題に取り組みます。
モデルの不一致、環境の変化、タスクの選択などのいくつかの不確実性要因の下でターゲットの閉ループのパフォーマンスが最適化されるように、パラメータ化可能な制御アーキテクチャのオンラインおよびオンザフライ学習ベースの適応のためのデータ効率の高い方法を提案します。
この取り組みの新規性は、実行可能なデジタル ツインによって可能になるブラック ボックス最適化を活用し、微分を使わない方法によるデータ駆動型のハイパーパラメータ調整を利用して、AD モジュールをリアルタイムで直接適応させることにあります。
私たちが提案する方法では、ランダム化とオンライン トレーニングの段階で、現実世界との最小限のインタラクションが必要です。
具体的には、実際の実験でアプローチを検証し、非線形モデルの予測コントローラーを 10 分以内に転送して安全に調整できることを示し、一日がかりの手動調整や数時間に及ぶ機械学習のトレーニング フェーズの必要性を排除します。
私たちの結果は、オンラインに適応した NMPC が外乱を直接補正し、シミュレーションおよび 1 つの特定のタスクにおけるオーバーチューニングを回避し、多数の軌道にわたって 15cm 未満の追跡精度を一般化し、83% の追跡改善につながることを示しています。
要約(オリジナル)
In this work, we address the problem of transferring an autonomous driving (AD) module from one domain to another, in particular from simulation to the real world (Sim2Real). We propose a data-efficient method for online and on-the-fly learning based adaptation for parametrizable control architectures such that the target closed-loop performance is optimized under several uncertainty sources such as model mismatches, environment changes and task choice. The novelty of the work resides in leveraging black-box optimization enabled by executable digital twins, with data-driven hyper-parameter tuning through derivative-free methods to directly adapt in real-time the AD module. Our proposed method requires a minimal amount of interaction with the real-world in the randomization and online training phase. Specifically, we validate our approach in real-world experiments and show the ability to transfer and safely tune a nonlinear model predictive controller in less than 10 minutes, eliminating the need of day-long manual tuning and hours-long machine learning training phases. Our results show that the online adapted NMPC directly compensates for disturbances, avoids overtuning in simulation and for one specific task, and it generalizes for less than 15cm of tracking accuracy over a multitude of trajectories, and leads to 83% tracking improvement.
arxiv情報
著者 | Jean Pierre Allamaa,Panagiotis Patrinos,Herman Van der Auweraer,Tong Duy Son |
発行日 | 2024-02-26 15:15:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google