要約
コンフォーマル予測は、分布のない有限サンプル保証を伴う予測推論のフレームワークです。
ただし、キャリブレーションデータが不足している場合、情報のない予測セットを提供する傾向があります。
このペーパーでは、サンプルの効率を改善するために、合成データ(たとえば生成モデルからの合成データ)を組み込んだ新しいフレームワークである合成駆動の予測推論(SPPI)を紹介します。
私たちの方法のコアには、スコアトランスポーターがあります。信頼できる実際のデータからの不適合スコアを合成データからのものと並べる経験的分位マッピングです。
スコアトランスポーターをキャリブレーションプロセスに慎重に統合することにより、SPPIは、実際のデータ分布と合成データ分布について仮定することなく、有限サンプルのカバレッジ保証を実現することを証明します。
スコア分布が十分に調整されている場合、SPPIは標準的なコンフォーマル予測よりも実質的にタイトで有益な予測セットを生成します。
画像分類と表形式の回帰に関する実験は、データスカース設定の予測効率の顕著な改善を示しています。
要約(オリジナル)
Conformal prediction is a framework for predictive inference with a distribution-free, finite-sample guarantee. However, it tends to provide uninformative prediction sets when calibration data are scarce. This paper introduces Synthetic-powered predictive inference (SPPI), a novel framework that incorporates synthetic data — e.g., from a generative model — to improve sample efficiency. At the core of our method is a score transporter: an empirical quantile mapping that aligns nonconformity scores from trusted, real data with those from synthetic data. By carefully integrating the score transporter into the calibration process, SPPI provably achieves finite-sample coverage guarantees without making any assumptions about the real and synthetic data distributions. When the score distributions are well aligned, SPPI yields substantially tighter and more informative prediction sets than standard conformal prediction. Experiments on image classification and tabular regression demonstrate notable improvements in predictive efficiency in data-scarce settings.
arxiv情報
著者 | Meshi Bashari,Roy Maor Lotan,Yonghoon Lee,Edgar Dobriban,Yaniv Romano |
発行日 | 2025-05-19 17:55:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google