Predicted Embedding Power Regression for Large-Scale Out-of-Distribution Detection

要約

分布外 (OOD) の入力は、実際の機械学習システムのパフォーマンスと安全性を損なう可能性があります。
OOD 検出には多くの方法が存在し、解像度が低く、クラスが少ない小規模なデータセットでうまく機能しますが、大規模な OOD 検出用に開発された方法はほとんどありません。
既存の大規模な方法は、一般に、最先端のグループ化されたソフトマックス法などの最大分類確率に依存します。
この作業では、トレーニング プロセス中に学習したラベル分布に基づいて、予測されたクラス ラベルの確率を計算する新しいアプローチを開発します。
私たちの方法は、現在の最先端の方法よりも優れたパフォーマンスを発揮し、計算コストの増加はごくわずかです。
$14$ のデータセット全体で現在の方法に対して私たちの方法を評価し、AUROC (84.2 対 82.4) および AUPR (96.2 対 93.7) に関して統計的に有意な改善を達成します。

要約(オリジナル)

Out-of-distribution (OOD) inputs can compromise the performance and safety of real world machine learning systems. While many methods exist for OOD detection and work well on small scale datasets with lower resolution and few classes, few methods have been developed for large-scale OOD detection. Existing large-scale methods generally depend on maximum classification probability, such as the state-of-the-art grouped softmax method. In this work, we develop a novel approach that calculates the probability of the predicted class label based on label distributions learned during the training process. Our method performs better than current state-of-the-art methods with only a negligible increase in compute cost. We evaluate our method against contemporary methods across $14$ datasets and achieve a statistically significant improvement with respect to AUROC (84.2 vs 82.4) and AUPR (96.2 vs 93.7).

arxiv情報

著者 Hong Yang,William Gebhardt,Alexander G. Ororbia,Travis Desell
発行日 2023-03-14 16:57:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク