要約
分布外(OOD)入力は、現実世界の機械学習システムの性能と安全性を損なう可能性がある。OOD検出には多くの手法が存在し、解像度が低くクラス数が少ない小規模なデータセットではうまく機能しますが、大規模なOOD検出のために開発された手法はほとんどありません。既存の大規模な手法は、一般に、最先端のグループ化ソフトマックス法のような最大分類確率に依存している。本研究では、学習過程で学習したラベル分布に基づき、予測されるクラスラベルの確率を計算する新しいアプローチを開発する。本手法は、計算コストを無視できる程度に増加させるだけで、現在の最先端手法よりも優れた性能を発揮する。14$のデータセットにおいて、本手法を従来の手法と比較して評価したところ、AUROC(84.2 vs 82.4)とAUPR(96.2 vs 93.7)に関して、統計的に有意な改善を達成することができた。
要約(オリジナル)
Out-of-distribution (OOD) inputs can compromise the performance and safety of real world machine learning systems. While many methods exist for OOD detection and work well on small scale datasets with lower resolution and few classes, few methods have been developed for large-scale OOD detection. Existing large-scale methods generally depend on maximum classification probability, such as the state-of-the-art grouped softmax method. In this work, we develop a novel approach that calculates the probability of the predicted class label based on label distributions learned during the training process. Our method performs better than current state-of-the-art methods with only a negligible increase in compute cost. We evaluate our method against contemporary methods across $14$ datasets and achieve a statistically significant improvement with respect to AUROC (84.2 vs 82.4) and AUPR (96.2 vs 93.7).
arxiv情報
著者 | Hong Yang,William Gebhardt,Alexander G. Ororbia,Travis Desell |
発行日 | 2023-03-07 18:28:39+00:00 |
arxivサイト | arxiv_id(pdf) |