Adaptive Selective Sampling for Online Prediction with Experts

要約

専門家のアドバイスを受けて、バイナリ シーケンスのオンライン予測を検討します。
この設定では、最適な最悪の場合の後悔の保証を維持しながら、標準的な手順よりもはるかに少ないラベルを収集できる選択的サンプリング スキームを使用する、ラベル効率の高い予測アルゴリズムを考案します。
これらのアルゴリズムは、指数関数的に重み付けされた予測に基づいており、完全な専門家の有無にかかわらず設定に適しています。
1 人の専門家が他の専門家よりも期待値が厳密に優れているシナリオでは、ラベル効率の高い予測者のラベルの複雑さがラウンド数の平方根にほぼ比例することを示します。
最後に、ラベル効率の高い予測器の正規化された後悔が、プールベースのアクティブラーニングの既知のミニマックスレートと漸近的に一致できることを経験的に示す数値実験を提示し、良性の設定に最適に適応できることを示唆します。

要約(オリジナル)

We consider online prediction of a binary sequence with expert advice. For this setting, we devise label-efficient forecasting algorithms, which use a selective sampling scheme that enables collecting much fewer labels than standard procedures, while still retaining optimal worst-case regret guarantees. These algorithms are based on exponentially weighted forecasters, suitable for settings with and without a perfect expert. For a scenario where one expert is strictly better than the others in expectation, we show that the label complexity of the label-efficient forecaster scales roughly as the square root of the number of rounds. Finally, we present numerical experiments empirically showing that the normalized regret of the label-efficient forecaster can asymptotically match known minimax rates for pool-based active learning, suggesting it can optimally adapt to benign settings.

arxiv情報

著者 Rui M. Castro,Fredrik Hellström,Tim van Erven
発行日 2023-02-16 16:16:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク