MPOGames: Efficient Multimodal Partially Observable Dynamic Games


ゲーム理論的手法は、豊富なマルチエージェント インタラクションを伴う状況での計画と予測に一般的になりました。
最大エントロピー (MaxEnt) 動的ゲームはこの問題に対処しようとしますが、実際のアプローチは線形 2 次近似を使用して MaxEnt ナッシュ均衡を解決します。これは単峰性応答に制限されており、複数の局所的なナッシュ均衡があるシナリオには適していません。
問題を POMDP として再定式化することにより、ローカル ナッシュ均衡間の相互作用を捉える MaxEnt 動的ゲームを効率的に解く方法である MPOGames を提案します。
2 エージェントのマージのケーススタディを通じて、不確実性を意識したゲーム理論的手法の重要性を示します。
最後に、1/10 スケールの自動車プラットフォームでのハードウェア実験により、このアプローチのリアルタイム機能を証明します。


Game theoretic methods have become popular for planning and prediction in situations involving rich multi-agent interactions. However, these methods often assume the existence of a single local Nash equilibria and are hence unable to handle uncertainty in the intentions of different agents. While maximum entropy (MaxEnt) dynamic games try to address this issue, practical approaches solve for MaxEnt Nash equilibria using linear-quadratic approximations which are restricted to unimodal responses and unsuitable for scenarios with multiple local Nash equilibria. By reformulating the problem as a POMDP, we propose MPOGames, a method for efficiently solving MaxEnt dynamic games that captures the interactions between local Nash equilibria. We show the importance of uncertainty-aware game theoretic methods via a two-agent merge case study. Finally, we prove the real-time capabilities of our approach with hardware experiments on a 1/10th scale car platform.


著者 Oswin So,Paul Drews,Thomas Balch,Velin Dimitrov,Guy Rosman,Evangelos A. Theodorou
発行日 2023-05-23 12:57:21+00:00
カテゴリー: cs.GT, cs.RO, math.OC パーマリンク