Distribution-Free Inference for the Regression Function of Binary Classification

要約

2値分類のキー・オブジェクトの1つは,回帰関数,すなわち,入力が与えられたときのクラス・ラベルの条件付き期待値である.回帰関数を用いると、ベイズ最適分類器が定義できるだけでなく、対応する誤分類確率も符号化される。本稿では、ユーザーが選んだ任意の信頼度に対する真の回帰関数について、厳密で分布のない、非漸近的に保証された信頼域を構築するためのリサンプリングフレームワークを提示する。そして、そのフレームワークを実証するための具体的なアルゴリズムを提案する。構築された信頼域は強く整合的であること、すなわち、どのような誤ったモデルも長期的には確率1で除外されることが証明される。この排除は、おそらくほぼ正しい型境界で定量化される。最後に、数値実験によりアルゴリズムを検証し、近似的な漸近的信頼楕円と比較する。

要約(オリジナル)

One of the key objects of binary classification is the regression function, i.e., the conditional expectation of the class labels given the inputs. With the regression function not only a Bayes optimal classifier can be defined, but it also encodes the corresponding misclassification probabilities. The paper presents a resampling framework to construct exact, distribution-free and non-asymptotically guaranteed confidence regions for the true regression function for any user-chosen confidence level. Then, specific algorithms are suggested to demonstrate the framework. It is proved that the constructed confidence regions are strongly consistent, that is, any false model is excluded in the long run with probability one. The exclusion is quantified with probably approximately correct type bounds, as well. Finally, the algorithms are validated via numerical experiments, and the methods are compared to approximate asymptotic confidence ellipsoids.

arxiv情報

著者 Ambrus Tamás,Balázs Csanád Csáji
発行日 2023-08-03 15:52:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, stat.ML パーマリンク