Safe, Out-of-Distribution-Adaptive MPC with Conformalized Neural Network Ensembles

要約

我々は、安全な分布外適応モデル予測制御アルゴリズムである SODA-MPC を紹介します。このアルゴリズムは、学習済みモデルのアンサンブルを予測に使用し、信頼性の低い分布外 (OOD) 予測にフラグを立てるランタイム モニターを備えています。
OOD 状況が検出されると、SODA-MPC は到達可能性に基づいた安全なフォールバック制御戦略をトリガーし、到達可能性ベースの制御の安全性を維持しながら学習ベースのモデルの高いパフォーマンスを達成する制御フレームワークを実現します。
動的歩行者の間を走行する自動運転車のコンテキストでこの方法を実証します。SODA-MPC は歩行者予測にニューラル ネットワーク アンサンブルを使用します。
等角予測を使用して OOD 信号を校正し、ユーザーが指定した信頼レベルを前提として、偽陽性率を確率的に保証する OOD 検出器を導き出します。
分散運転中、MPC コントローラーはアンサンブルの平均によって予測された軌道に基づいて歩行者との衝突を回避します。
OOD 状態が検出されると、MPC は到達可能性ベースのコントローラーに切り替えて、歩行者の最大速度を想定して到達可能な歩行者との衝突を回避し、歩行者の最悪の行動下での安全を保証します。
私たちは、横断歩道シナリオにおける広範な自動運転シミュレーションで SODA-MPC を検証します。
私たちのモデル アンサンブルは実際の歩行者のデータを使用してトレーニングおよび校正されており、OOD 検出器が理論的に予測された範囲内で望ましい精度を取得していることがわかります。
我々は、同様に等角予測を使用するがOOD適応を行わない2つの最先端のMPC手法と比較して、安全性が向上し、タスク完了が向上することを経験的に示しています。
さらに、トレーニングとキャリブレーションに nuScenes データセットからの大規模な交通データを使用して、大規模なマルチエージェント予測器 Trajectron++ を使用した方法の有効性を実証します。

要約(オリジナル)

We present SODA-MPC, a Safe, Out-of-Distribution-Adaptive Model Predictive Control algorithm, which uses an ensemble of learned models for prediction, with a runtime monitor to flag unreliable out-of-distribution (OOD) predictions. When an OOD situation is detected, SODA-MPC triggers a safe fallback control strategy based on reachability, yielding a control framework that achieves the high performance of learning-based models while preserving the safety of reachability-based control. We demonstrate the method in the context of an autonomous vehicle, driving among dynamic pedestrians, where SODA-MPC uses a neural network ensemble for pedestrian prediction. We calibrate the OOD signal using conformal prediction to derive an OOD detector with probabilistic guarantees on the false-positive rate, given a user-specified confidence level. During in-distribution operation, the MPC controller avoids collisions with a pedestrian based on the trajectory predicted by the mean of the ensemble. When OOD conditions are detected, the MPC switches to a reachability-based controller to avoid collisions with the reachable set of the pedestrian assuming a maximum pedestrian speed, to guarantee safety under the worst-case actions of the pedestrian. We verify SODA-MPC in extensive autonomous driving simulations in a pedestrian-crossing scenario. Our model ensemble is trained and calibrated with real pedestrian data, showing that our OOD detector obtains the desired accuracy rate within a theoretically-predicted range. We empirically show improved safety and improved task completion compared with two state-of-the-art MPC methods that also use conformal prediction, but without OOD adaptation. Further, we demonstrate the effectiveness of our method with the large-scale multi-agent predictor Trajectron++, using large-scale traffic data from the nuScenes dataset for training and calibration.

arxiv情報

著者 Polo Contreras,Ola Shorinwa,Mac Schwager
発行日 2024-11-29 18:20:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク