STOOD-X methodology: using statistical nonparametric test for OOD Detection Large-Scale datasets enhanced with explainability

要約

分布外(OOD)検出は機械学習において重要なタスクであり、特にモデルの失敗が重大な結果をもたらす可能性がある安全性に敏感なアプリケーションにおいて重要である。しかし、現在のOOD検出手法は、しばしば制限的な分布仮定、限られたスケーラビリティ、解釈可能性の欠如に悩まされている。これらの課題に対処するために、我々はSTOOD-Xを提案する。STOOD-Xは、OOD検出のための統計的ノンパラメトリック検定と、エクスプレナビリティの拡張を組み合わせた2段階の方法論である。第一段階では、STOOD-Xは特徴空間距離とWilcoxon-Mann-Whitney検定を用いて、特定の特徴分布を仮定することなくOODサンプルを識別する。第2段階では、BLUE XAIのパラダイムに沿った、各決定を駆動する特徴を明らかにする、ユーザーフレンドリーで概念に基づいた視覚的説明を生成する。ベンチマークデータセットと複数のアーキテクチャでの広範な実験を通して、STOOD-Xは、特に高次元で複雑な設定において、最先端のポストホックOOD検出器に対して競争力のある性能を達成した。さらに、その説明可能性フレームワークは、人間による監視、バイアス検出、モデルデバッグを可能にし、人間とAIシステム間の信頼と協調を促進する。したがって、STOOD-Xの手法は、実世界のOOD検出タスクに対して、ロバストで、説明可能で、スケーラブルなソリューションを提供する。

要約(オリジナル)

Out-of-Distribution (OOD) detection is a critical task in machine learning, particularly in safety-sensitive applications where model failures can have serious consequences. However, current OOD detection methods often suffer from restrictive distributional assumptions, limited scalability, and a lack of interpretability. To address these challenges, we propose STOOD-X, a two-stage methodology that combines a Statistical nonparametric Test for OOD Detection with eXplainability enhancements. In the first stage, STOOD-X uses feature-space distances and a Wilcoxon-Mann-Whitney test to identify OOD samples without assuming a specific feature distribution. In the second stage, it generates user-friendly, concept-based visual explanations that reveal the features driving each decision, aligning with the BLUE XAI paradigm. Through extensive experiments on benchmark datasets and multiple architectures, STOOD-X achieves competitive performance against state-of-the-art post hoc OOD detectors, particularly in high-dimensional and complex settings. In addition, its explainability framework enables human oversight, bias detection, and model debugging, fostering trust and collaboration between humans and AI systems. The STOOD-X methodology therefore offers a robust, explainable, and scalable solution for real-world OOD detection tasks.

arxiv情報

著者 Iván Sevillano-García,Julián Luengo,Francisco Herrera
発行日 2025-04-03 15:26:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.HC, cs.LG, stat.ML パーマリンク