Conformal Validity Guarantees Exist for Any Data Distribution


機械学習 (ML) が広く採用されるにつれ、実務者は、これらのシステムが被るリスクを定量化して制御する手段をますます求めています。
この課題は、ブラック ボックス最適化やアクティブ ラーニングなど、ML システムが独自のデータを収集する自律性を持っている場合に特に顕著であり、そのアクションによりデータ分布に連続的なフィードバック ループのシフトが引き起こされます。
この研究では、最も一般的なケースで計算するのは非常に非現実的ですが、理論的には共形予測が交換可能または準交換可能のものだけでなく \textit{any} 結合データ分布にも拡張できることを証明します。


As machine learning (ML) gains widespread adoption, practitioners are increasingly seeking means to quantify and control the risk these systems incur. This challenge is especially salient when ML systems have autonomy to collect their own data, such as in black-box optimization and active learning, where their actions induce sequential feedback-loop shifts in the data distribution. Conformal prediction has emerged as a promising approach to uncertainty and risk quantification, but existing variants either fail to accommodate sequences of data-dependent shifts, or do not fully exploit the fact that agent-induced shift is under our control. In this work we prove that conformal prediction can theoretically be extended to \textit{any} joint data distribution, not just exchangeable or quasi-exchangeable ones, although it is exceedingly impractical to compute in the most general case. For practical applications, we outline a procedure for deriving specific conformal algorithms for any data distribution, and we use this procedure to derive tractable algorithms for a series of agent-induced covariate shifts. We evaluate the proposed algorithms empirically on synthetic black-box optimization and active learning tasks.


著者 Drew Prinster,Samuel Stanton,Anqi Liu,Suchi Saria
発行日 2024-05-10 17:40:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク