Learning in Online Principle-Agent Interactions: The Power of Menus

要約

私たちは、オンラインのプリンシパル-エージェント問題におけるユビキタスな学習課題を研究します。この際、プリンシパルは、過去のやり取りでエージェントが明らかにした好みからエージェントの個人情報を学習します。
このパラダイムには、最近の文献で広く研究されている、価格設定や契約設計などの重要な特殊なケースが含まれています。
ただし、既存の研究では、プリンシパルがエージェントと対話するために各ラウンドで 1 つの戦略しか選択できず、エージェントの行動を通じて明らかになった好みを観察できる場合が考慮されています。
この論文では、プリンシパルがエージェントに戦略のメニューを提供し、メニューからのエージェントの選択を観察することからさらに学習できるように、この研究ラインを拡張します。
私たちは、私たちが開発した対応するアルゴリズムとともに、いくつかのオンライン プリンシパル エージェントの問題設定を徹底的に調査し、そのサンプルの複雑さを特徴付けます。
私たちはこのパラダイムを、Stackelberg (セキュリティ) ゲーム、契約設計、情報設計など、いくつかの重要な設計問題に具体化します。
最後に、Stackelberg ゲームでのオンライン学習に関する調査結果と既存の結果との関連性も調査し、Peng らの重要な困難な事例を克服できるソリューションを提供します。
(2019年)。

要約(オリジナル)

We study a ubiquitous learning challenge in online principal-agent problems during which the principal learns the agent’s private information from the agent’s revealed preferences in historical interactions. This paradigm includes important special cases such as pricing and contract design, which have been widely studied in recent literature. However, existing work considers the case where the principal can only choose a single strategy at every round to interact with the agent and then observe the agent’s revealed preference through their actions. In this paper, we extend this line of study to allow the principal to offer a menu of strategies to the agent and learn additionally from observing the agent’s selection from the menu. We provide a thorough investigation of several online principal-agent problem settings and characterize their sample complexities, accompanied by the corresponding algorithms we have developed. We instantiate this paradigm to several important design problems $-$ including Stackelberg (security) games, contract design, and information design. Finally, we also explore the connection between our findings and existing results about online learning in Stackelberg games, and we offer a solution that can overcome a key hard instance of Peng et al. (2019).

arxiv情報

著者 Minbiao Han,Michael Albert,Haifeng Xu
発行日 2023-12-15 15:14:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.LG パーマリンク