要約
生成モデルは、医療診断、自動運転、気候科学など、信頼性の高い意思決定が正確な不確実性の定量化に依存する重要な分野で大きな可能性を示しています。
確率的等角予測 (PCP) はこの目的に強力なフレームワークを提供しますが、複雑な基礎となる分布と有限数の生成されたサンプルを扱う場合、そのカバレッジ効率 (不確実性セットのサイズ) は制限されます。
この論文では、最初にランク付けされたサンプルの不適合スコアをベクトル化し、次に同じランクのサンプルの分位数を変更することで予測セットの形状を最適化することで効率を高める新しい PCP フレームワークを提案します。
私たちの方法は、不連続でより効率的な予測セットを生成しながら有効な範囲を提供するため、一か八かのアプリケーションに特に適しています。
私たちは、合成データセットと現実世界のデータセットの両方での実験を通じて、アプローチの有効性を実証します。
要約(オリジナル)
Generative models have shown significant promise in critical domains such as medical diagnosis, autonomous driving, and climate science, where reliable decision-making hinges on accurate uncertainty quantification. While probabilistic conformal prediction (PCP) offers a powerful framework for this purpose, its coverage efficiency — the size of the uncertainty set — is limited when dealing with complex underlying distributions and a finite number of generated samples. In this paper, we propose a novel PCP framework that enhances efficiency by first vectorizing the non-conformity scores with ranked samples and then optimizing the shape of the prediction set by varying the quantiles for samples at the same rank. Our method delivers valid coverage while producing discontinuous and more efficient prediction sets, making it particularly suited for high-stakes applications. We demonstrate the effectiveness of our approach through experiments on both synthetic and real-world datasets.
arxiv情報
著者 | Minxing Zheng,Shixiang Zhu |
発行日 | 2024-10-17 16:37:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google