要約
私たちは、変数の欠落やノイズの多いトレーニング データの破損に対して堅牢な、保証されたカバー率を持つ予測セットを生成する方法を開発します。
私たちのアプローチは、i.i.d 仮定の下で有効な予測セットを構築するための強力なフレームワークである等角予測に基づいて構築されています。
重要なのは、破損によって引き起こされる分布シフトのため、この設定では等角予測を単純に適用しても信頼できる予測が得られないことです。
分布の変化を考慮して、特権情報 (PI) へのアクセスを想定しています。
PI は分布の変化を説明する追加の特徴として定式化されますが、これらはトレーニング中にのみ利用可能であり、テスト時には存在しません。
我々は、重み付き等角予測の新しい一般化を導入することでこの問題にアプローチし、理論的なカバレッジ保証で我々の方法をサポートします。
実際のデータセットと合成データセットの両方に対する実証実験は、理論的保証によってサポートされていない既存の方法と比較して、私たちのアプローチが有効なカバー率を達成し、より有益な予測を構築することを示しています。
要約(オリジナル)
We develop a method to generate prediction sets with a guaranteed coverage rate that is robust to corruptions in the training data, such as missing or noisy variables. Our approach builds on conformal prediction, a powerful framework to construct prediction sets that are valid under the i.i.d assumption. Importantly, naively applying conformal prediction does not provide reliable predictions in this setting, due to the distribution shift induced by the corruptions. To account for the distribution shift, we assume access to privileged information (PI). The PI is formulated as additional features that explain the distribution shift, however, they are only available during training and absent at test time. We approach this problem by introducing a novel generalization of weighted conformal prediction and support our method with theoretical coverage guarantees. Empirical experiments on both real and synthetic datasets indicate that our approach achieves a valid coverage rate and constructs more informative predictions compared to existing methods, which are not supported by theoretical guarantees.
arxiv情報
著者 | Shai Feldman,Yaniv Romano |
発行日 | 2025-01-09 15:47:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google