要約
等角予測器は、エラー頻度に対する厳密な統計的保証の利点を享受しますが、対応する予測セットのサイズは、実際の実用性にとって重要です。
残念ながら、現在、有限サンプル分析とその予測セットのサイズの保証が不足しています。
この不足に対処するために、分割等角予測フレームワークの下で予測セットの予想サイズを理論的に定量化します。
通常、この正確な定式化は直接計算できないため、簡単に計算できる点推定値と高確率区間をさらに導き出し、テスト データと校正データのさまざまな実現可能性にわたって予想される予測セット サイズを特徴付ける実用的な方法を提供します。
さらに、回帰問題と分類問題の両方について、実世界のデータセットでの実験により結果の有効性を確認します。
要約(オリジナル)
While conformal predictors reap the benefits of rigorous statistical guarantees for their error frequency, the size of their corresponding prediction sets is critical to their practical utility. Unfortunately, there is currently a lack of finite-sample analysis and guarantees for their prediction set sizes. To address this shortfall, we theoretically quantify the expected size of the prediction set under the split conformal prediction framework. As this precise formulation cannot usually be calculated directly, we further derive point estimates and high probability intervals that can be easily computed, providing a practical method for characterizing the expected prediction set size across different possible realizations of the test and calibration data. Additionally, we corroborate the efficacy of our results with experiments on real-world datasets, for both regression and classification problems.
arxiv情報
著者 | Guneet S. Dhillon,George Deligiannidis,Tom Rainforth |
発行日 | 2023-06-12 17:22:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google