Prediction-Powered Inference

要約

予測を利用した推論は、実験データセットに機械学習システムからの予測が補足された場合に、有効な統計的推論を実行するためのフレームワークです。
このフレームワークは、予測を提供する機械学習アルゴリズムについていかなる仮定も行わずに、平均値、分位数、線形回帰係数やロジスティック回帰係数などの数量に対する証明可能で有効な信頼区間を計算するためのシンプルなアルゴリズムを生成します。
さらに、予測がより正確になると、信頼区間が小さくなります。
予測を活用した推論により、研究者は機械学習を使用して有効かつよりデータ効率の高い結論を導き出すことができる可能性があります。
予測を利用した推論の利点は、プロテオミクス、天文学、ゲノミクス、リモート センシング、国勢調査分析、生態学のデータセットを使用して実証されています。

要約(オリジナル)

Prediction-powered inference is a framework for performing valid statistical inference when an experimental dataset is supplemented with predictions from a machine-learning system. The framework yields simple algorithms for computing provably valid confidence intervals for quantities such as means, quantiles, and linear and logistic regression coefficients, without making any assumptions on the machine-learning algorithm that supplies the predictions. Furthermore, more accurate predictions translate to smaller confidence intervals. Prediction-powered inference could enable researchers to draw valid and more data-efficient conclusions using machine learning. The benefits of prediction-powered inference are demonstrated with datasets from proteomics, astronomy, genomics, remote sensing, census analysis, and ecology.

arxiv情報

著者 Anastasios N. Angelopoulos,Stephen Bates,Clara Fannjiang,Michael I. Jordan,Tijana Zrnic
発行日 2023-11-09 17:48:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.QM, stat.ME, stat.ML パーマリンク