On Imperfect Recall in Multi-Agent Influence Diagrams

要約

マルチエージェント影響図 (MAID) は、ベイジアン ネットワークに基づいた人気のあるゲーム理論モデルです。
一部の設定では、MAID は拡張形式のゲーム表現に比べて大きな利点をもたらします。
MAID に関するこれまでの研究では、エージェントが行動ポリシーを採用し、各決定のアクションに対して独立した条件付き確率分布を設定すると仮定していました。
しかし、記憶が不完全な状況では、行動方針におけるナッシュ均衡が存在しない可能性があります。
混合ポリシーと 2 種類の相関均衡を使用して、物忘れやぼんやりしたエージェントによる MAID を解決する方法を示すことで、この問題を克服します。
また、MAID における主要な意思決定問題の計算の複雑さを分析し、扱いやすいケースを調査します。
最後に、不完全なリコールがしばしば避けられないマルコフ ゲームやチーム状況への MAID の適用について説明します。

要約(オリジナル)

Multi-agent influence diagrams (MAIDs) are a popular game-theoretic model based on Bayesian networks. In some settings, MAIDs offer significant advantages over extensive-form game representations. Previous work on MAIDs has assumed that agents employ behavioural policies, which set independent conditional probability distributions over actions for each of their decisions. In settings with imperfect recall, however, a Nash equilibrium in behavioural policies may not exist. We overcome this by showing how to solve MAIDs with forgetful and absent-minded agents using mixed policies and two types of correlated equilibrium. We also analyse the computational complexity of key decision problems in MAIDs, and explore tractable cases. Finally, we describe applications of MAIDs to Markov games and team situations, where imperfect recall is often unavoidable.

arxiv情報

著者 James Fox,Matt MacDermott,Lewis Hammond,Paul Harrenstein,Alessandro Abate,Michael Wooldridge
発行日 2023-07-11 07:08:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, cs.MA パーマリンク