要約
私たちは、専門家のアドバイスフレームワークを使用したオンラインバイナリ予測の一般化を研究します。各ラウンドで、学習者は$K$の専門家のプールから$m\geq 1$の専門家を選ぶことができ、全体的なユーティリティはモジュールまたはサブモジュール関数です。
選ばれた専門家たち。
私たちは、専門家が戦略的に行動する状況に焦点を当て、イベントについての信念を誤って報告する可能性があることで、アルゴリズムの予測に対する影響力を最大化することを目指しています。
とりわけ、この設定は、学習者がさまざまな予測者を集約して予測を行うだけでなく、相対的なパフォーマンスに応じて予測者をランク付けしようとする予測コンテストに応用できます。
私たちの目標は、次の 2 つの要件を満たすアルゴリズムを設計することです: 1) $\textit{インセンティブ互換}$: 専門家に自分の信念を正直に報告するようインセンティブを与える、および 2) $\textit{後悔なし}$: サブリニア後悔を達成する
後から考えると、最も固定された $m$ の専門家たちの本当の信念に関しては。
以前の研究では、$m=1$ の場合のこのフレームワークを研究し、この問題に対してインセンティブと互換性のある後悔のないアルゴリズムを提供しました。
まず、問題を $m=1$ 設定に単純に縮小することは効率的でも効果的でもないことを示します。
次に、ユーティリティ関数の特定の構造を利用して 2 つの望ましい目標を達成するアルゴリズムを提供します。
要約(オリジナル)
We study a generalization of the online binary prediction with expert advice framework where at each round, the learner is allowed to pick $m\geq 1$ experts from a pool of $K$ experts and the overall utility is a modular or submodular function of the chosen experts. We focus on the setting in which experts act strategically and aim to maximize their influence on the algorithm’s predictions by potentially misreporting their beliefs about the events. Among others, this setting finds applications in forecasting competitions where the learner seeks not only to make predictions by aggregating different forecasters but also to rank them according to their relative performance. Our goal is to design algorithms that satisfy the following two requirements: 1) $\textit{Incentive-compatible}$: Incentivize the experts to report their beliefs truthfully, and 2) $\textit{No-regret}$: Achieve sublinear regret with respect to the true beliefs of the best fixed set of $m$ experts in hindsight. Prior works have studied this framework when $m=1$ and provided incentive-compatible no-regret algorithms for the problem. We first show that a simple reduction of our problem to the $m=1$ setting is neither efficient nor effective. Then, we provide algorithms that utilize the specific structure of the utility functions to achieve the two desired goals.
arxiv情報
著者 | Omid Sadeghi,Maryam Fazel |
発行日 | 2023-05-24 16:43:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google