Follower Agnostic Methods for Stackelberg Games

要約

私たちは、フォロワーに依存しない方法で (おそらく複数のフォロワーを含む) Stackelberg ゲームのクラスを解決するアルゴリズムを提案します。
特に、他の現代の研究とは異なり、私たちのアルゴリズムは、リーダーの目的の勾配や、フォロワーの効用関数や戦略空間に関する知識についてのオラクル推定器の使用を必要としません。
代わりに、リーダーが特別に設計された戦略でフォロワーを調査することで得られる特別に構築された勾配推定器を使用して戦略を更新する 2 ループ アルゴリズムを設計します。
フォロワーを受信すると、フォロワーの共同戦略が平衡近くに収束するような適応ルールが適用されます。これは、前述の勾配推定器を構築するためにリーダーが観察する唯一の情報です。
閉ループ関数の凸性がない場合のリーダーの目的の静止点への非漸近収束率を提供し、さらにリーダーの目的の極小値への漸近収束を示します。

要約(オリジナル)

We propose an algorithm to solve a class of Stackelberg games (possibly with multiple followers) in a follower agnostic manner. Particularly, unlike other contemporary works, our algorithm does not require the use of an oracle estimator for the gradient of the leader’s objective or knowledge about the follower’s utility function or strategy space. Instead, we design two-loop algorithm where the leader updates its strategies using specially constructed gradient estimator obtained by probing followers with specially designed strategies. Upon receiving the followers engage in an adaptation rule such that the joint strategy of followers converges near equilibrium which is the only information observed by leader to construct the aforementioned gradient estimator. We provide non-asymptotic convergence rates to stationary points of the leader’s objective in the absence of convexity of the closed-loop function and further show asymptotic convergence to a local minima of the leader’s objective.

arxiv情報

著者 Chinmay Maheshwari,S. Shankar Sasty,Lillian Ratliff,Eric Mazumdar
発行日 2023-05-24 17:43:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 91A65, cs.AI, cs.GT, math.DS, math.OC パーマリンク