Data Augmentation is a Hyperparameter: Cherry-picked Self-Supervision for Unsupervised Anomaly Detection is Creating the Illusion of Success


自己教師あり学習 (SSL) は、現実世界の問題に対する監視シグナルを作成し、手動によるラベル付けにかかる膨大なコストを回避するための有望な代替手段として浮上しています。
SSL は、ラベル付き異常がまれであるか存在しないことが多い異常検出 (AD) などの教師なしタスクに特に魅力的です。
画像データの SSL ベース AD (SSAD) には、拡張関数の大規模なカタログが使用されており、最近の研究では、拡張の種類が精度に大きな影響を与えることが報告されています。
これらに動機付けられたこの研究は、画像ベースの SSAD をより大きな視野で捉え、SSAD におけるデータ拡張の役割を調査することに着手しました。
3 つの異なる検出器モデルと 420 の AD タスクにわたる広範な実験を通じて、データ増強と異常生成メカニズムの間の調整が SSAD の成功の鍵であり、それが欠如している場合には SSL がさらに機能する可能性があるという包括的な数値的および視覚的証拠を提供します。
私たちの知る限り、これは SSAD におけるデータ拡張の役割に関する最初のメタ分析です。


Self-supervised learning (SSL) has emerged as a promising alternative to create supervisory signals to real-world problems, avoiding the extensive cost of manual labeling. SSL is particularly attractive for unsupervised tasks such as anomaly detection (AD), where labeled anomalies are rare or often nonexistent. A large catalog of augmentation functions has been used for SSL-based AD (SSAD) on image data, and recent works have reported that the type of augmentation has a significant impact on accuracy. Motivated by those, this work sets out to put image-based SSAD under a larger lens and investigate the role of data augmentation in SSAD. Through extensive experiments on 3 different detector models and across 420 AD tasks, we provide comprehensive numerical and visual evidences that the alignment between data augmentation and anomaly-generating mechanism is the key to the success of SSAD, and in the lack thereof, SSL may even impair accuracy. To the best of our knowledge, this is the first meta-analysis on the role of data augmentation in SSAD.


著者 Jaemin Yoo,Tiancheng Zhao,Leman Akoglu
発行日 2023-07-19 14:39:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG パーマリンク