要約
我々は、正常なデータセットが欠陥領域で汚染されており、その製品クラス分布が尾を引いているが未知であるという、実際的に困難な環境における教師なし異常検出を解決することを目的とする。既存のモデルは、画素ノイズに対してロバストであれば、テールクラスのサンプルでは性能が低下し、その逆であれば性能が低下するという、テール対ノイズのトレードオフに苦しんでいる。この問題を軽減するために、我々はテールクラスとノイズサンプルを独立に扱う。この目的のために、埋め込み類似度のクラス毎の分布に関する対称的な仮定に基づいてサンプルのクラスカーディナリティを推定する、新しいクラスサイズ予測器であるTailSamplerを提案する。TailSamplerは、テールクラスのサンプルを排他的にサンプリングするために利用することができ、それらを別々に扱うことを可能にする。これらの特徴に基づき、我々はメモリベースの異常検知モデルTailedCoreを構築する。教師なしロングテールノイズ異常検出の設定でTailedCoreの有効性を広範囲に検証し、TailedCoreがほとんどの設定で最先端技術を凌駕することを示す。
要約(オリジナル)
We aim to solve unsupervised anomaly detection in a practical challenging environment where the normal dataset is both contaminated with defective regions and its product class distribution is tailed but unknown. We observe that existing models suffer from tail-versus-noise trade-off where if a model is robust against pixel noise, then its performance deteriorates on tail class samples, and vice versa. To mitigate the issue, we handle the tail class and noise samples independently. To this end, we propose TailSampler, a novel class size predictor that estimates the class cardinality of samples based on a symmetric assumption on the class-wise distribution of embedding similarities. TailSampler can be utilized to sample the tail class samples exclusively, allowing to handle them separately. Based on these facets, we build a memory-based anomaly detection model TailedCore, whose memory both well captures tail class information and is noise-robust. We extensively validate the effectiveness of TailedCore on the unsupervised long-tail noisy anomaly detection setting, and show that TailedCore outperforms the state-of-the-art in most settings.
arxiv情報
| 著者 | Yoon Gyo Jung,Jaewoo Park,Jaeho Yoon,Kuan-Chuan Peng,Wonchul Kim,Andrew Beng Jin Teoh,Octavia Camps |
| 発行日 | 2025-04-03 17:14:57+00:00 |
| arxivサイト | arxiv_id(pdf) |