Neurosymbolic Meta-Reinforcement Lookahead Learning Achieves Safe Self-Driving in Non-Stationary Environments

要約

学習主導型の人工知能の進歩の分野では、機械学習 (ML) を自動運転 (SD) テクノロジーに統合することは、エンジニアリング上の偉業と言えます。
しかし、制御された実験室シナリオの範囲外の実世界のアプリケーションでは、自動運転技術の展開は人命に関わる重要な役割を担っており、研究者は安全性と効率性の両方に高い注意を払う必要があります。
たとえば、自動運転モデル​​がリアルタイム実行中に不慣れな環境に遭遇した場合、期待されるパフォーマンスを向上させることだけに重点を置く必要はありません。
その実行またはリアルタイム適応が必要なレベルの安全性を維持することを保証することについても同様の考慮を払わなければなりません。
この研究では、\emph{Neurosymbolic Meta-Reinforcement Lookahead Learning} (NUMERLA) に基づく先読み記号制約を採用した、オンライン メタ強化学習のアルゴリズムを紹介します。
NUMERLA は、長期的な安全性を確保するという包括的な目標とオンライン適応の効率を調和させる先読み更新メカニズムを提案しています。
実験結果は、NUMERLA が自動運転エージェントにリアルタイム適応能力を与え、非定常都市における人と車両の相互作用シナリオ下での安全で自己適応的な運転につながることを実証しています。

要約(オリジナル)

In the area of learning-driven artificial intelligence advancement, the integration of machine learning (ML) into self-driving (SD) technology stands as an impressive engineering feat. Yet, in real-world applications outside the confines of controlled laboratory scenarios, the deployment of self-driving technology assumes a life-critical role, necessitating heightened attention from researchers towards both safety and efficiency. To illustrate, when a self-driving model encounters an unfamiliar environment in real-time execution, the focus must not solely revolve around enhancing its anticipated performance; equal consideration must be given to ensuring its execution or real-time adaptation maintains a requisite level of safety. This study introduces an algorithm for online meta-reinforcement learning, employing lookahead symbolic constraints based on \emph{Neurosymbolic Meta-Reinforcement Lookahead Learning} (NUMERLA). NUMERLA proposes a lookahead updating mechanism that harmonizes the efficiency of online adaptations with the overarching goal of ensuring long-term safety. Experimental results demonstrate NUMERLA confers the self-driving agent with the capacity for real-time adaptability, leading to safe and self-adaptive driving under non-stationary urban human-vehicle interaction scenarios.

arxiv情報

著者 Haozhe Lei,Quanyan Zhu
発行日 2023-09-05 15:47:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY, stat.ML パーマリンク