要約
私たちは、単一の利己的な行為者を特定の行動に向けて説得するために、情報優位性のシグナリングを備えた複数の送信者を考慮します。
独創的なベイジアン説得フレームワークを一般化すると、このような設定は、計算経済学、マルチエージェント学習、および複数の目的を持った機械学習において広く普及しています。
ここでの中心的なソリューション概念は、送信者のシグナリング ポリシーのナッシュ均衡です。
理論的には、一般に平衡を見つけることは PPAD 困難であることを証明します。
実際、送信者の最良の応答を計算することさえ NP 困難です。
これらの本質的な困難を考慮して、局所的なナッシュ均衡を見つけることに移ります。
我々は、このゲームの非線形で不連続なユーティリティを近似するための新しい微分可能なニューラル ネットワークを提案します。
これを超勾配アルゴリズムで補完すると、パレートが完全な啓示平衡と既存のニューラル ネットワークによって見出される局所平衡を支配することがわかります。
概して、私たちの理論的および経験的貢献は、広範な種類の経済問題に対して興味深いものです。
要約(オリジナル)
We consider multiple senders with informational advantage signaling to convince a single self-interested actor towards certain actions. Generalizing the seminal Bayesian Persuasion framework, such settings are ubiquitous in computational economics, multi-agent learning, and machine learning with multiple objectives. The core solution concept here is the Nash equilibrium of senders’ signaling policies. Theoretically, we prove that finding an equilibrium in general is PPAD-Hard; in fact, even computing a sender’s best response is NP-Hard. Given these intrinsic difficulties, we turn to finding local Nash equilibria. We propose a novel differentiable neural network to approximate this game’s non-linear and discontinuous utilities. Complementing this with the extra-gradient algorithm, we discover local equilibria that Pareto dominates full-revelation equilibria and those found by existing neural networks. Broadly, our theoretical and empirical contributions are of interest to a large class of economic problems.
arxiv情報
著者 | Safwan Hossain,Tonghan Wang,Tao Lin,Yiling Chen,David C. Parkes,Haifeng Xu |
発行日 | 2024-02-07 15:50:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google