Learning Optimal Tax Design in Nonatomic Congestion Games

要約

マルチプレイヤー ゲームでは、プレイヤー間の利己的な行動が社会福祉を損なう可能性があります。
税金の仕組みは、この問題を軽減し、社会的に最適な行動を誘導するための一般的な方法です。
この作業では、混雑ゲームにおける限られたフィードバックで社会福祉を最大化できる最適な税を学習する最初のステップを踏みます。
私たちは \emph{均衡フィードバック} という名前の新しいタイプのフィードバックを提案します。このフィードバックでは、税金設計者は税金計画を展開した後にのみナッシュ均衡を観察できます。
既存のアルゴリズムは、指数関数的に大きい税関数空間、勾配の存在、および目的の非凸性のため適用できません。
これらの課題に取り組むために、私たちはいくつかの新しいコンポーネントを活用する計算効率の高いアルゴリズムを設計します。(1) 最適な税を近似するための区分的線形税。
(2) 強く凸のポテンシャル関数を保証するための追加の線形項。
(3) ゲームに関する重要な情報を提供できる探索税を見つけるための効率的なサブルーチン。
このアルゴリズムは、$O(\beta F^2/\epsilon)$ サンプル複雑度で $\epsilon$-最適な税金を見つけることができます。ここで、$\beta$ はコスト関数の滑らかさ、$F$ は施設の数です。

要約(オリジナル)

In multiplayer games, self-interested behavior among the players can harm the social welfare. Tax mechanisms are a common method to alleviate this issue and induce socially optimal behavior. In this work, we take the initial step of learning the optimal tax that can maximize social welfare with limited feedback in congestion games. We propose a new type of feedback named \emph{equilibrium feedback}, where the tax designer can only observe the Nash equilibrium after deploying a tax plan. Existing algorithms are not applicable due to the exponentially large tax function space, nonexistence of the gradient, and nonconvexity of the objective. To tackle these challenges, we design a computationally efficient algorithm that leverages several novel components: (1) a piece-wise linear tax to approximate the optimal tax; (2) extra linear terms to guarantee a strongly convex potential function; (3) an efficient subroutine to find the exploratory tax that can provide critical information about the game. The algorithm can find an $\epsilon$-optimal tax with $O(\beta F^2/\epsilon)$ sample complexity, where $\beta$ is the smoothness of the cost function and $F$ is the number of facilities.

arxiv情報

著者 Qiwen Cui,Maryam Fazel,Simon S. Du
発行日 2025-01-15 14:02:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA パーマリンク