ExIFFI and EIF+: Interpretability and Enhanced Generalizability to Extend the Extended Isolation Forest

要約

異常検出には、複雑なデータセットやシステム内での異常な動作の特定が含まれます。
機械学習アルゴリズムと意思決定支援システム (DSS) はこのタスクに対して効果的なソリューションを提供しますが、実際のアプリケーションでは単に異常を正確に特定するだけでは不十分であることが判明する可能性があります。
ユーザーは、根本原因の分析を促進し、モデルへの信頼を高めるために、これらの予測の背後にある理論的根拠についての洞察を必要としています。
ただし、AD の教師なしの性質により、解釈可能なツールを開発する際に課題が生じます。
この文書では、Extended Isolation Forest によって行われた予測を説明するために特別に設計された新しい解釈可能性アプローチである ExIFFI を紹介することで、この課題に対処します。
ExIFFI は、機能の重要性を活用して、グローバル レベルとローカル レベルの両方で説明を提供します。
この研究では、Extended Isolation Forest の拡張バリアントである EIF+ も導入されており、異なる分割超平面設計戦略を通じて一般化機能を向上させることを目的としています。
合成データセットと現実世界のデータセットの両方を使用して、包括的な比較分析が実行され、さまざまな教師なし AD アプローチが評価されます。
この分析は、AD 予測の説明を提供する際の ExIFFI の有効性を示しています。
さらに、この論文では、教師なし設定における特徴選択手法としての ExIFFI の有用性についても検討しています。
最後に、この研究はオープンソース コードを提供することで研究コミュニティに貢献し、さらなる調査と再現性を促進します。

要約(オリジナル)

Anomaly Detection involves identifying unusual behaviors within complex datasets and systems. While Machine Learning algorithms and Decision Support Systems (DSSs) offer effective solutions for this task, simply pinpointing anomalies may prove insufficient in real-world applications. Users require insights into the rationale behind these predictions to facilitate root cause analysis and foster trust in the model. However, the unsupervised nature of AD presents a challenge in developing interpretable tools. This paper addresses this challenge by introducing ExIFFI, a novel interpretability approach specifically designed to explain the predictions made by Extended Isolation Forest. ExIFFI leverages feature importance to provide explanations at both global and local levels. This work also introduces EIF+, an enhanced variant of Extended Isolation Forest, conceived to improve its generalization capabilities through a different splitting hyperplanes design strategy. A comprehensive comparative analysis is conducted, employing both synthetic and real-world datasets to evaluate various unsupervised AD approaches. The analysis demonstrates the effectiveness of ExIFFI in providing explanations for AD predictions. Furthermore, the paper explores the utility of ExIFFI as a feature selection technique in unsupervised settings. Finally, this work contributes to the research community by providing open-source code, facilitating further investigation and reproducibility.

arxiv情報

著者 Alessio Arcudi,Davide Frizzo,Chiara Masiero,Gian Antonio Susto
発行日 2024-04-09 14:41:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.AP, stat.ML パーマリンク