要約
ダイナミック シュタッケルベルク ゲームは、リーダーが最初に行動し、フォロワーがリーダーの戦略に対する応答戦略を選択する、広範なクラスの 2 人用ゲームです。
残念ながら、フォロワーの最良応答演算子 (リーダーの制御の関数として) は通常、分析的に扱いにくいため、明示的に解決できるのは様式化された Stackelberg ゲームのみです。
この論文は、\textit{フォロワーの最良応答演算子} が、リーダーに適応された開ループ制御のコンパクトなサブセット上で一律に \textit{注意ベースのニューラル演算子} によって近似的に実装できることを示すことで、この問題に対処します。
さらに、フォロワーが近似最良応答演算子を使用する Stackelberg ゲームの値が、元の Stackelberg ゲームの値に近似することを示します。
私たちの主な結果は、平方積分可能で適応された確率過程の空間間の注意ベースのニューラル演算子に対する普遍近似定理と、Stackelberg ゲームの一般的なクラスの安定性の結果を使用して得られます。
要約(オリジナル)
Dynamic Stackelberg games are a broad class of two-player games in which the leader acts first, and the follower chooses a response strategy to the leader’s strategy. Unfortunately, only stylized Stackelberg games are explicitly solvable since the follower’s best-response operator (as a function of the control of the leader) is typically analytically intractable. This paper addresses this issue by showing that the \textit{follower’s best-response operator} can be approximately implemented by an \textit{attention-based neural operator}, uniformly on compact subsets of adapted open-loop controls for the leader. We further show that the value of the Stackelberg game where the follower uses the approximate best-response operator approximates the value of the original Stackelberg game. Our main result is obtained using our universal approximation theorem for attention-based neural operators between spaces of square-integrable adapted stochastic processes, as well as stability results for a general class of Stackelberg games.
arxiv情報
著者 | Guillermo Alvarez,Ibrahim Ekren,Anastasis Kratsios,Xuwei Yang |
発行日 | 2024-11-14 18:12:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google