Think Deep and Fast: Learning Neural Nonlinear Opinion Dynamics from Inverse Dynamic Games for Split-Second Interactions

要約

非協力的なインタラクションは、カーレースなどのマルチエージェントのシナリオで一般的に発生します。このシナリオでは、自我車両は、ライバルを追い抜くか、安全な追い越しの「回廊」が開くまでライバルの後ろに留まるかを選択できます。
専門家である人間は、このような時間に敏感な意思決定をうまく行うことができますが、個別の選択肢を迅速に推論できる、安全で効率的なゲーム理論的な軌道プランナーの開発はまだ十分に取り組まれていません。
最近開発された非線形オピニオン ダイナミクス (NOD) は、迅速な意見形成を可能にし、安全性が重要なデッドロックを回避する上で有望であることが示されています。
ただし、絶えず変化する相互作用環境を考慮して、NOD のモデル パラメーターを自動的かつ適応的に決定することは、依然として未解決の課題です。
この研究では、相互作用するエージェントの (おそらく不完全な) 状態とアクションの軌跡を含むデータセットとして与えられる、専門家のデモンストレーションからニューラル NOD モデルを合成するための、学習ベースのゲーム理論的アプローチを初めて提案します。
学習された NOD は、既存の動的ゲーム ソルバーによって使用され、他のエージェントの意図の予測変化を考慮しながら断固とした計画を立てることができるため、計画における状況認識が可能になります。
私たちは、シミュレートされた自律走行レースの例で、迅速かつ堅牢な意思決定を行う Neural NOD の能力を実証し、最先端のデータ駆動型のゲーム理論に基づいた計画手法と比較して、安全性と追い越しパフォーマンスの目に見える改善につながります。

要約(オリジナル)

Non-cooperative interactions commonly occur in multi-agent scenarios such as car racing, where an ego vehicle can choose to overtake the rival, or stay behind it until a safe overtaking ‘corridor’ opens. While an expert human can do well at making such time-sensitive decisions, the development of safe and efficient game-theoretic trajectory planners capable of rapidly reasoning discrete options is yet to be fully addressed. The recently developed nonlinear opinion dynamics (NOD) show promise in enabling fast opinion formation and avoiding safety-critical deadlocks. However, it remains an open challenge to determine the model parameters of NOD automatically and adaptively, accounting for the ever-changing environment of interaction. In this work, we propose for the first time a learning-based, game-theoretic approach to synthesize a Neural NOD model from expert demonstrations, given as a dataset containing (possibly incomplete) state and action trajectories of interacting agents. The learned NOD can be used by existing dynamic game solvers to plan decisively while accounting for the predicted change of other agents’ intents, thus enabling situational awareness in planning. We demonstrate Neural NOD’s ability to make fast and robust decisions in a simulated autonomous racing example, leading to tangible improvements in safety and overtaking performance over state-of-the-art data-driven game-theoretic planning methods.

arxiv情報

著者 Haimin Hu,Jonathan DeCastro,Deepak Gopinath,Guy Rosman,Naomi Ehrich Leonard,Jaime Fernández Fisac
発行日 2024-06-14 08:09:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク