Safe, Out-of-Distribution-Adaptive MPC with Conformalized Neural Network Ensembles

要約

SoDA-MPCは、予測に学習されたモデルのアンサンブルを使用する安全で分散型に適したモデル予測制御アルゴリズムであり、実行時間モニターを使用して信頼できない分散分布(OOD)予測にフラグを立てます。
OODの状況が検出されると、SODA-MPCはリーチ性に基づいて安全なフォールバック制御戦略をトリガーし、リーチ可能性ベースの制御の安全性を維持しながら、学習ベースのモデルの高性能を達成する制御フレームワークを生成します。
Soda-MPCが歩行者の予測のためにニューラルネットワークアンサンブルを使用する動的な歩行者の間を運転する自律車両のコンテキストで方法を実証します。
適合予測を使用してOOD信号を調整し、ユーザー指定の信頼レベルを考慮して、偽陽性レートを確率的に保証するOOD検出器を導き出します。
分布中の操作中、MPCコントローラーは、アンサンブルの平均によって予測される軌道に基づいて、歩行者との衝突を回避します。
ood条件が検出されると、MPCは到達可能性ベースのコントローラーに切り替えて、歩行者の最大のアクションで安全を保証するために、最大の歩行者速度を想定して歩行者の到達可能なセットとの衝突を回避します。
歩行者を渡るシナリオで、広範な自律運転シミュレーションでソーダ-MPCを確認します。
私たちのモデルアンサンブルは、実際の歩行者データでトレーニングおよび較正されており、当社のOOD検出器が理論的に予測された範囲内で望ましい精度を取得することを示しています。
適応は適応なしでも、適応を使用することなく、2つの最先端のMPCメソッドと比較して、安全性の向上と改善されたタスクの完了を経験的に示しています。
さらに、トレーニングとキャリブレーションのためにNuscenes Datasetの大規模なトラフィックデータを使用して、大規模なマルチエージェント予測子Trajectron ++を使用した方法の有効性を実証します。

要約(オリジナル)

We present SODA-MPC, a Safe, Out-of-Distribution-Adaptive Model Predictive Control algorithm, which uses an ensemble of learned models for prediction, with a runtime monitor to flag unreliable out-of-distribution (OOD) predictions. When an OOD situation is detected, SODA-MPC triggers a safe fallback control strategy based on reachability, yielding a control framework that achieves the high performance of learning-based models while preserving the safety of reachability-based control. We demonstrate the method in the context of an autonomous vehicle, driving among dynamic pedestrians, where SODA-MPC uses a neural network ensemble for pedestrian prediction. We calibrate the OOD signal using conformal prediction to derive an OOD detector with probabilistic guarantees on the false-positive rate, given a user-specified confidence level. During in-distribution operation, the MPC controller avoids collisions with a pedestrian based on the trajectory predicted by the mean of the ensemble. When OOD conditions are detected, the MPC switches to a reachability-based controller to avoid collisions with the reachable set of the pedestrian assuming a maximum pedestrian speed, to guarantee safety under the worst-case actions of the pedestrian. We verify SODA-MPC in extensive autonomous driving simulations in a pedestrian-crossing scenario. Our model ensemble is trained and calibrated with real pedestrian data, showing that our OOD detector obtains the desired accuracy rate within a theoretically-predicted range. We empirically show improved safety and improved task completion compared with two state-of-the-art MPC methods that also use conformal prediction, but without OOD adaptation. Further, we demonstrate the effectiveness of our method with the large-scale multi-agent predictor Trajectron++, using large-scale traffic data from the nuScenes dataset for training and calibration.

arxiv情報

著者 Jose Leopoldo Contreras,Ola Shorinwa,Mac Schwager
発行日 2025-06-04 14:49:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク