要約
協力ゲームで他のユーザーと最適に調整するには、多くの場合、協力者に関する情報を得ることが重要です。運転を成功させるには、道路のどちら側を運転するかを理解する必要があります。
ただし、協力者のすべての機能が戦略的に関連しているわけではありません。最適な調整を維持する一方で、ドライバーのきめ細かい加速は無視される可能性があります。
戦略的に関連のある情報と無関係な情報の間には、明確に定義された二分法があることを示します。
さらに、動的ゲームでは、この二項対立がベルマン バックアップ オペレーターを介して効率的に計算できるコンパクトな表現を持つことを示します。
このアルゴリズムを適用して、オーバークック環境の標準バージョンと部分的に観察可能なバージョンの両方で、タスクに戦略的に関連する情報を分析します。
理論的および経験的な結果は、私たちのアルゴリズムがベースラインよりも大幅に効率的であることを示しています。
ビデオは https://minknowledge.github.io でご覧いただけます。
要約(オリジナル)
To optimally coordinate with others in cooperative games, it is often crucial to have information about one’s collaborators: successful driving requires understanding which side of the road to drive on. However, not every feature of collaborators is strategically relevant: the fine-grained acceleration of drivers may be ignored while maintaining optimal coordination. We show that there is a well-defined dichotomy between strategically relevant and irrelevant information. Moreover, we show that, in dynamic games, this dichotomy has a compact representation that can be efficiently computed via a Bellman backup operator. We apply this algorithm to analyze the strategically relevant information for tasks in both a standard and a partially observable version of the Overcooked environment. Theoretical and empirical results show that our algorithms are significantly more efficient than baselines. Videos are available at https://minknowledge.github.io.
arxiv情報
著者 | Niklas Lauffer,Ameesh Shah,Micah Carroll,Michael Dennis,Stuart Russell |
発行日 | 2023-06-15 17:43:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google