MPOGames: Efficient Multimodal Partially Observable Dynamic Games

要約

ゲーム理論的手法は、豊富なマルチエージェント インタラクションを伴う状況での計画と予測に一般的になりました。
ただし、これらの方法は、単一の局所ナッシュ均衡の存在を前提としていることが多く、そのため、さまざまなエージェントの意図の不確実性を処理できません。
最大エントロピー (MaxEnt) 動的ゲームはこの問題に対処しようとしますが、実際のアプローチは線形 2 次近似を使用して MaxEnt ナッシュ均衡を解決します。これは単峰性応答に制限されており、複数の局所的なナッシュ均衡があるシナリオには適していません。
問題を POMDP として再定式化することにより、ローカル ナッシュ均衡間の相互作用を捉える MaxEnt 動的ゲームを効率的に解く方法である MPOGames を提案します。
2 エージェントのマージのケーススタディを通じて、不確実性を意識したゲーム理論的手法の重要性を示します。
最後に、1/10 スケールの自動車プラットフォームでのハードウェア実験により、このアプローチのリアルタイム機能を証明します。

要約(オリジナル)

Game theoretic methods have become popular for planning and prediction in situations involving rich multi-agent interactions. However, these methods often assume the existence of a single local Nash equilibria and are hence unable to handle uncertainty in the intentions of different agents. While maximum entropy (MaxEnt) dynamic games try to address this issue, practical approaches solve for MaxEnt Nash equilibria using linear-quadratic approximations which are restricted to unimodal responses and unsuitable for scenarios with multiple local Nash equilibria. By reformulating the problem as a POMDP, we propose MPOGames, a method for efficiently solving MaxEnt dynamic games that captures the interactions between local Nash equilibria. We show the importance of uncertainty-aware game theoretic methods via a two-agent merge case study. Finally, we prove the real-time capabilities of our approach with hardware experiments on a 1/10th scale car platform.

arxiv情報

著者 Oswin So,Paul Drews,Thomas Balch,Velin Dimitrov,Guy Rosman,Evangelos A. Theodorou
発行日 2023-05-23 12:57:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.RO, math.OC パーマリンク