On the Geometry of Receiver Operating Characteristic and Precision-Recall Curves

要約

バイナリ分類問題における受信機動作特性(ROC)および精密リコール(PR)曲線のジオメトリを研究します。
重要な発見は、最も一般的に使用されるバイナリ分類メトリックの多くは、単に構成関数の関数である$ g:= f_p \ circ f_n^{ – 1} $であることです。
この幾何学的視点は、動作点の選択を容易にし、決定のしきい値の効果を理解し、分類子間の比較を促進します。
また、ROC/PR曲線の形状とジオメトリが分類器の動作をどのように反映するかを説明するのにも役立ち、コンテキスト固有の制約を備えた特定のアプリケーション向けに最適化された分類器を構築するための客観的なツールを提供します。
さらに、分類器の優位性の条件を調査し、ROCおよびPR形状に対するクラスの分離性と分散の影響を示す分析的および数値的な例を提示し、陽性クラスの漏れ関数$ g(\ cdot)$とKullback-Leibler Divergenceとの間のリンクを導き出します。
このフレームワークは、モデルのキャリブレーション、コストに敏感な最適化、実際の容量制約の下での操作ポイント選択などの実用的な考慮事項を強調し、分類器の展開と意思決定により多くの情報に基づいたアプローチを可能にします。

要約(オリジナル)

We study the geometry of Receiver Operating Characteristic (ROC) and Precision-Recall (PR) curves in binary classification problems. The key finding is that many of the most commonly used binary classification metrics are merely functions of the composition function $G := F_p \circ F_n^{-1}$, where $F_p(\cdot)$ and $F_n(\cdot)$ are the class-conditional cumulative distribution functions of the classifier scores in the positive and negative classes, respectively. This geometric perspective facilitates the selection of operating points, understanding the effect of decision thresholds, and comparison between classifiers. It also helps explain how the shapes and geometry of ROC/PR curves reflect classifier behavior, providing objective tools for building classifiers optimized for specific applications with context-specific constraints. We further explore the conditions for classifier dominance, present analytical and numerical examples demonstrating the effects of class separability and variance on ROC and PR geometries, and derive a link between the positive-to-negative class leakage function $G(\cdot)$ and the Kullback–Leibler divergence. The framework highlights practical considerations, such as model calibration, cost-sensitive optimization, and operating point selection under real-world capacity constraints, enabling more informed approaches to classifier deployment and decision-making.

arxiv情報

著者 Reza Sameni
発行日 2025-06-12 15:36:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, math.ST, stat.ML, stat.TH パーマリンク