Data Quality Monitoring through Transfer Learning on Anomaly Detection for the Hadron Calorimeters


センサーの普及により、監視、診断、予測アプリケーションなどのさまざまな目的で、多くのドメインに膨大な量の時空間 (ST) データがもたらされます。
転移学習 (TL) メカニズムは、新しいタスクに事前トレーニングされたモデルを利用することで、データの希薄性とモデルの複雑さを軽減することを約束します。
コンピューター ビジョンや自然言語処理などの分野における TL の勝利にもかかわらず、異常検出 (AD) アプリケーションのための複雑な ST モデルの取り組みは限られています。
この研究では、CERN でのコンパクト ミュオン ソレノイド実験のハドロン熱量計の AD の文脈における TL の可能性を紹介します。
熱量計のある部分から収集されたデータに基づいてトレーニングされた ST AD モデルを別の部分に転送しました。
我々は、ST AD モデルの半教師ありオートエンコーダ上の TL のさまざまな構成、つまりエンコーダ ネットワークとデコーダ ネットワークの両方の畳み込み、グラフ、リカレント ニューラル ネットワークの転送を調査しました。
実験結果は、TL がターゲット サブ検出器のモデル学習精度を効果的に向上させることを示しています。
TL は、AD モデルのトレーニング可能なパラメーターを大幅に削減しながら、有望なデータ再構成と AD パフォーマンスを実現します。
また、半教師あり AD モデルのトレーニング データ セットにおける異常汚染に対する堅牢性も向上します。


The proliferation of sensors brings an immense volume of spatio-temporal (ST) data in many domains for various purposes, including monitoring, diagnostics, and prognostics applications. Data curation is a time-consuming process for a large volume of data, making it challenging and expensive to deploy data analytics platforms in new environments. Transfer learning (TL) mechanisms promise to mitigate data sparsity and model complexity by utilizing pre-trained models for a new task. Despite the triumph of TL in fields like computer vision and natural language processing, efforts on complex ST models for anomaly detection (AD) applications are limited. In this study, we present the potential of TL within the context of AD for the Hadron Calorimeter of the Compact Muon Solenoid experiment at CERN. We have transferred the ST AD models trained on data collected from one part of a calorimeter to another. We have investigated different configurations of TL on semi-supervised autoencoders of the ST AD models — transferring convolutional, graph, and recurrent neural networks of both the encoder and decoder networks. The experiment results demonstrate that TL effectively enhances the model learning accuracy on a target subdetector. The TL achieves promising data reconstruction and AD performance while substantially reducing the trainable parameters of the AD models. It also improves robustness against anomaly contamination in the training data sets of the semi-supervised AD models.


著者 Mulugeta Weldezgina Asres,Christian Walter Omlin,Long Wang,Pavel Parygin,David Yu,Jay Dittmann,The CMS-HCAL Collaboration
発行日 2024-08-29 15:19:06+00:00
cs.LG