Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection

要約

教師なし異常検知(unsupervised anomaly detection, UAD)の研究において、最先端のモデルは公開ベンチマークデータセットでの広範な研究により飽和点に達しているが、検知性能のために大規模なオーダーメイドのニューラルネットワーク(NN)を採用したり、様々なタスクのための統一モデルを追求している。エッジコンピューティングに向けては、大規模で複雑なNNを回避する、計算効率が高くスケーラブルなソリューションの開発が必要である。このことに動機づけられ、我々はNNの設定を最小限の変更でUADの性能を最適化することを目指す。そのため、我々は再構成-by-inpaintingアプローチを再検討し、長所と短所を分析することにより、それを改善するために再考する。SOTA法の長所は、ランダムな多重マスキングの課題である推論遅延と出力の矛盾を解決する単一の決定論的マスキングアプローチである。とはいえ、異常領域を完全にカバーするマスクを提供できないという問題は、残された弱点である。この問題を軽減するために、我々は2つのMLP層のみを採用し、復号時に異常再構成の特徴情報を減衰させる特徴減衰表現(FADeR:Feature Attenuation of Defective Representation)を提案する。FADeRを活用することで、未見の異常パターンの特徴が、既知の正常パターンに再構成され、誤警報が減少する。実験結果は、FADeRが同規模のNNと比較して高い性能を達成することを示している。さらに、本アプローチは、他の単一の決定論的マスキング手法とプラグアンドプレイ方式で統合した場合に、性能向上のスケーラビリティを示す。

要約(オリジナル)

In unsupervised anomaly detection (UAD) research, while state-of-the-art models have reached a saturation point with extensive studies on public benchmark datasets, they adopt large-scale tailor-made neural networks (NN) for detection performance or pursued unified models for various tasks. Towards edge computing, it is necessary to develop a computationally efficient and scalable solution that avoids large-scale complex NNs. Motivated by this, we aim to optimize the UAD performance with minimal changes to NN settings. Thus, we revisit the reconstruction-by-inpainting approach and rethink to improve it by analyzing strengths and weaknesses. The strength of the SOTA methods is a single deterministic masking approach that addresses the challenges of random multiple masking that is inference latency and output inconsistency. Nevertheless, the issue of failure to provide a mask to completely cover anomalous regions is a remaining weakness. To mitigate this issue, we propose Feature Attenuation of Defective Representation (FADeR) that only employs two MLP layers which attenuates feature information of anomaly reconstruction during decoding. By leveraging FADeR, features of unseen anomaly patterns are reconstructed into seen normal patterns, reducing false alarms. Experimental results demonstrate that FADeR achieves enhanced performance compared to similar-scale NNs. Furthermore, our approach exhibits scalability in performance enhancement when integrated with other single deterministic masking methods in a plug-and-play manner.

arxiv情報

著者 YeongHyeon Park,Sungho Kang,Myung Jin Kim,Hyeong Seok Kim,Juneho Yi
発行日 2024-07-05 15:44:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク