要約
エネルギー消費データの異常を検出することは、エネルギーの無駄や機器の故障を特定し、全体として効率的なエネルギー管理を確保するために重要です。
機械学習、特にディープラーニングのアプローチは、異常検出において大きな成功を収めています。
ただし、これらはブラックボックスのアプローチであり、透明性や説明が提供されていません。
SHAP とその変形は、これらのモデルを説明するために提案されていますが、高い計算複雑性 (SHAP) や、不安定性と不一致 (カーネル SHAP など) の問題があります。
これらの課題に対処するために、この論文では、コンテキスト関連情報に焦点を当てた、エネルギー消費データの異常に対する説明可能性アプローチを提案します。
提案されたアプローチは、SHAP バリアントに焦点を当てた既存の説明可能性手法を活用し、グローバル特徴重要度および加重コサイン類似度とともに、各異常点のコンテキストに基づいて背景データセットを選択します。
このアプローチは、コンテキストと最も関連性の高い機能に焦点を当てることにより、説明可能性アルゴリズムの不安定性を軽減します。
10 の異なる機械学習モデル、5 つのデータセット、および 5 つの XAI 手法にわたる実験結果は、私たちの方法が説明のばらつきを減らし、一貫した説明を提供することを示しています。
統計分析により、私たちのアプローチの堅牢性が確認され、複数のデータセットにわたって平均約 38% の変動の減少が示されました。
要約(オリジナル)
Detecting anomalies in energy consumption data is crucial for identifying energy waste, equipment malfunction, and overall, for ensuring efficient energy management. Machine learning, and specifically deep learning approaches, have been greatly successful in anomaly detection; however, they are black-box approaches that do not provide transparency or explanations. SHAP and its variants have been proposed to explain these models, but they suffer from high computational complexity (SHAP) or instability and inconsistency (e.g., Kernel SHAP). To address these challenges, this paper proposes an explainability approach for anomalies in energy consumption data that focuses on context-relevant information. The proposed approach leverages existing explainability techniques, focusing on SHAP variants, together with global feature importance and weighted cosine similarity to select background dataset based on the context of each anomaly point. By focusing on the context and most relevant features, this approach mitigates the instability of explainability algorithms. Experimental results across 10 different machine learning models, five datasets, and five XAI techniques, demonstrate that our method reduces the variability of explanations providing consistent explanations. Statistical analyses confirm the robustness of our approach, showing an average reduction in variability of approximately 38% across multiple datasets.
arxiv情報
著者 | Mohammad Noorchenarboo,Katarina Grolinger |
発行日 | 2025-01-10 16:53:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google