要約
この作業では、標準的なソリューションの概念全体にわたる厳格な平衡として望ましい動作をインストールするための報酬設計フレームワークを開発します:支配的な戦略平衡、ナッシュ平衡、相関平衡、および粗い相関平衡。
また、フレームワークを拡張して、各ソリューションの概念のマルコフに最適な同等物をキャプチャします。
私たちのフレームワークの中心は、目的のソリューションの概念と動作の構造に基づいて、厳密にインストール可能な包括的な数学的特性評価です。
これらの特性は、効率的な反復アルゴリズムにつながります。これは、線形プログラミングを通じて最適化の目標を処理するために一般化します。
最後に、結果がどのように境界のある合理的なエージェントに一般化するかを探ります。
要約(オリジナル)
In this work, we develop a reward design framework for installing a desired behavior as a strict equilibrium across standard solution concepts: dominant strategy equilibrium, Nash equilibrium, correlated equilibrium, and coarse correlated equilibrium. We also extend our framework to capture the Markov-perfect equivalents of each solution concept. Central to our framework is a comprehensive mathematical characterization of strictly installable, based on the desired solution concept and the behavior’s structure. These characterizations lead to efficient iterative algorithms, which we generalize to handle optimization objectives through linear programming. Finally, we explore how our results generalize to bounded rational agents.
arxiv情報
著者 | Jeremy McMahan,Young Wu,Yudong Chen,Xiaojin Zhu,Qiaomin Xie |
発行日 | 2025-03-05 17:11:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google