Semiparametric conformal prediction

要約

多くのリスクに敏感なアプリケーションには、複数の潜在的に相関するターゲット変数にわたって十分に調整された予測セットが必要であり、予測アルゴリズムが相関エラーを報告する場合があります。
この作業では、ベクター値の非変性スコアの共同相関構造を占めるコンフォーマル予測セットを構築することを目指しています。
多変量分位​​とセミパラメトリック統計に関する豊富な文献から、$ \ alpha $がユーザー指定のミスベージレートです。
特に、ノンパラメトリックブドウcopulasを使用してスコアの関節累積分布関数(CDF)を柔軟に推定し、その影響関数を使用して分位分位推定の漸近効率を改善します。
つる分解により、私たちの方法は多数のターゲットに適切にスケーリングすることができます。
漸近的に正確なカバレッジを保証するだけでなく、私たちの方法は、キャリブレーションセットにランダムなラベルが欠落している人を含む、さまざまな現実世界の回帰問題の希望のカバレッジと競争効率をもたらします。

要約(オリジナル)

Many risk-sensitive applications require well-calibrated prediction sets over multiple, potentially correlated target variables, for which the prediction algorithm may report correlated errors. In this work, we aim to construct the conformal prediction set accounting for the joint correlation structure of the vector-valued non-conformity scores. Drawing from the rich literature on multivariate quantiles and semiparametric statistics, we propose an algorithm to estimate the $1-\alpha$ quantile of the scores, where $\alpha$ is the user-specified miscoverage rate. In particular, we flexibly estimate the joint cumulative distribution function (CDF) of the scores using nonparametric vine copulas and improve the asymptotic efficiency of the quantile estimate using its influence function. The vine decomposition allows our method to scale well to a large number of targets. As well as guaranteeing asymptotically exact coverage, our method yields desired coverage and competitive efficiency on a range of real-world regression problems, including those with missing-at-random labels in the calibration set.

arxiv情報

著者 Ji Won Park,Robert Tibshirani,Kyunghyun Cho
発行日 2025-03-11 15:58:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク