Anomalies, Representations, and Self-Supervision

要約

対照学習を使用した密度ベースの異常検出のための自己教師あり手法を開発し、CMS ADC2021 のイベントレベルの異常データを使用してテストします。
AnomalyCLR 手法はデータ駆動型であり、バックグラウンド データの拡張を使用して、モデルに依存しない方法で非標準モデルのイベントを模倣します。
順列不変の Transformer Encoder アーキテクチャを使用して、コライダー イベントで測定されたオブジェクトを表現空間にマッピングします。データ拡張により、潜在的な異常な特徴に敏感な表現空間が定義されます。
背景表現でトレーニングされた AutoEncoder は、表現空間内のさまざまな信号の異常スコアを計算します。
AnomalyCLR を使用すると、生データのベースラインと比較して、すべての信号のパフォーマンス メトリクスが大幅に向上していることがわかります。

要約(オリジナル)

We develop a self-supervised method for density-based anomaly detection using contrastive learning, and test it using event-level anomaly data from CMS ADC2021. The AnomalyCLR technique is data-driven and uses augmentations of the background data to mimic non-Standard-Model events in a model-agnostic way. It uses a permutation-invariant Transformer Encoder architecture to map the objects measured in a collider event to the representation space, where the data augmentations define a representation space which is sensitive to potential anomalous features. An AutoEncoder trained on background representations then computes anomaly scores for a variety of signals in the representation space. With AnomalyCLR we find significant improvements on performance metrics for all signals when compared to the raw data baseline.

arxiv情報

著者 Barry M. Dillon,Luigi Favaro,Friedrich Feiden,Tanmoy Modak,Tilman Plehn
発行日 2024-08-07 15:07:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, hep-ex, hep-ph パーマリンク