Conformal Validity Guarantees Exist for Any Data Distribution (and How to Find Them)

要約

人工知能 (AI) / 機械学習 (ML) が広く採用されるにつれ、実務者はこれらのシステムが被るリスクを定量化して制御する手段をますます求めています。
この課題は、ブラック ボックス最適化やアクティブ ラーニングなど、システムが独自のデータを収集する自律性を備えている場合に特に顕著になります。システムのアクションにより、データ分散における連続的なフィードバック ループのシフトが引き起こされます。
等角予測は、不確実性とリスクの定量化に対する有望なアプローチですが、以前のバリアントの妥当性保証では、データ分布に関する何らかの形の「準交換可能性」が想定されており、それによって多くの種類の逐次シフトが除外されていました。
この論文では、共形予測が交換可能または準交換可能なものだけでなく \textit{any} 結合データ分布にも理論的に拡張できることを証明します。
最も一般的なケースは計算が非常に非現実的ですが、具体的な実用的な応用のために、あらゆるデータ分布に対する特定の等角アルゴリズムを導出する手順の概要を示し、この手順を使用して AI/ML エージェントによって引き起こされる一連の共変量に対する扱いやすいアルゴリズムを導出します。
シフトします。
提案されたアルゴリズムを合成ブラックボックス最適化と能動学習タスクに関して経験的に評価します。

要約(オリジナル)

As artificial intelligence (AI) / machine learning (ML) gain widespread adoption, practitioners are increasingly seeking means to quantify and control the risk these systems incur. This challenge is especially salient when such systems have autonomy to collect their own data, such as in black-box optimization and active learning, where their actions induce sequential feedback-loop shifts in the data distribution. Conformal prediction is a promising approach to uncertainty and risk quantification, but prior variants’ validity guarantees have assumed some form of “quasi-exchangeability” on the data distribution, thereby excluding many types of sequential shifts. In this paper we prove that conformal prediction can theoretically be extended to \textit{any} joint data distribution, not just exchangeable or quasi-exchangeable ones. Although the most general case is exceedingly impractical to compute, for concrete practical applications we outline a procedure for deriving specific conformal algorithms for any data distribution, and we use this procedure to derive tractable algorithms for a series of AI/ML-agent-induced covariate shifts. We evaluate the proposed algorithms empirically on synthetic black-box optimization and active learning tasks.

arxiv情報

著者 Drew Prinster,Samuel Stanton,Anqi Liu,Suchi Saria
発行日 2024-06-05 15:49:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク