要約
推定のクラス全体で同時に有効な信頼区間を構築することは、複数の平均推定、機械学習の境界一般化エラー、適応実験設計などのタスクの中心です。
これを「エラー推定問題」としてフレーム化します。ここで、目標は、推定クラスの最大誤差の高度な上限を決定することです。
ランダムエラーの潜在的に未知の相関構造に自然に適応する有限クラスと無限のクラス設定の両方に対して、そのような境界を導き出す完全にデータ駆動型のアプローチを提案します。
特に、私たちの方法では、クラスの複雑さを入力として必要とせず、タラグランドの不平等に基づいた組合の境界や境界などの既存のアプローチの大きな制限を克服する必要はありません。
この論文では、シンプルでありながら一般的なソリューションを提示し、複数の有効な信頼区間の構築からコンテキスト盗賊アルゴリズムの探索の最適化に至るまでのアプリケーションを通じて柔軟性を実証します。
要約(オリジナル)
Constructing confidence intervals that are simultaneously valid across a class of estimates is central for tasks such as multiple mean estimation, bounding generalization error in machine learning, and adaptive experimental design. We frame this as an ‘error estimation problem,’ where the goal is to determine a high-probability upper bound on the maximum error for a class of estimates. We propose an entirely data-driven approach that derives such bounds for both finite and infinite class settings, naturally adapting to a potentially unknown correlation structure of random errors. Notably, our method does not require class complexity as an input, overcoming a major limitation of existing approaches such as union bounding and bounds based on Talagrand’s inequality. In this paper, we present our simple yet general solution and demonstrate its flexibility through applications ranging from constructing multiple simultaneously valid confidence intervals to optimizing exploration in contextual bandit algorithms.
arxiv情報
| 著者 | Sanath Kumar Krishnamurthy,Anan Lyubarskaja,Emma Brunskill,Susan Athey |
| 発行日 | 2025-02-28 17:10:30+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google