No-Regret Online Prediction with Strategic Experts


私たちは、専門家のアドバイスフレームワークを使用したオンラインバイナリ予測の一般化を研究します。各ラウンドで、学習者は$K$の専門家のプールから$m\geq 1$の専門家を選ぶことができ、全体的なユーティリティはモジュールまたはサブモジュール関数です。
私たちの目標は、次の 2 つの要件を満たすアルゴリズムを設計することです: 1) $\textit{インセンティブ互換}$: 専門家に自分の信念を正直に報告するようインセンティブを与える、および 2) $\textit{後悔なし}$: サブリニア後悔を達成する
後から考えると、最も固定された $m$ の専門家たちの本当の信念に関しては。
以前の研究では、$m=1$ の場合のこのフレームワークを研究し、この問題に対してインセンティブと互換性のある後悔のないアルゴリズムを提供しました。
まず、問題を $m=1$ 設定に単純に縮小することは効率的でも効果的でもないことを示します。
次に、ユーティリティ関数の特定の構造を利用して 2 つの望ましい目標を達成するアルゴリズムを提供します。


We study a generalization of the online binary prediction with expert advice framework where at each round, the learner is allowed to pick $m\geq 1$ experts from a pool of $K$ experts and the overall utility is a modular or submodular function of the chosen experts. We focus on the setting in which experts act strategically and aim to maximize their influence on the algorithm’s predictions by potentially misreporting their beliefs about the events. Among others, this setting finds applications in forecasting competitions where the learner seeks not only to make predictions by aggregating different forecasters but also to rank them according to their relative performance. Our goal is to design algorithms that satisfy the following two requirements: 1) $\textit{Incentive-compatible}$: Incentivize the experts to report their beliefs truthfully, and 2) $\textit{No-regret}$: Achieve sublinear regret with respect to the true beliefs of the best fixed set of $m$ experts in hindsight. Prior works have studied this framework when $m=1$ and provided incentive-compatible no-regret algorithms for the problem. We first show that a simple reduction of our problem to the $m=1$ setting is neither efficient nor effective. Then, we provide algorithms that utilize the specific structure of the utility functions to achieve the two desired goals.


著者 Omid Sadeghi,Maryam Fazel
発行日 2023-05-24 16:43:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.GT, cs.LG パーマリンク