Binary Noise for Binary Tasks: Masked Bernoulli Diffusion for Unsupervised Anomaly Detection

要約

画像生成用のノイズ除去拡散モデルの高性能により、教師なし医療異常検出への応用への道が開かれました。
拡散ベースの手法は大量の GPU メモリを必要とし、サンプリング時間が長いため、潜在ベルヌーイ拡散モデルに基づいた、新しくて高速な教師なし異常検出アプローチを提案します。
まずオートエンコーダを適用して、入力画像をバイナリ潜在表現に圧縮します。
次に、ベルヌーイ ノイズ スケジュールに従う拡散モデルがこの潜在空間に適用され、摂動されたものからバイナリ潜在表現を復元するようにトレーニングされます。
この拡散モデルのバイナリの性質により、ノイズ除去プロセス中にバイナリ コードを反転する可能性が高い潜在空間内のエントリ (分布外のデータを示す) を識別することができます。
これらの確率に基づいて、異常検出スコアを向上させるマスキング アルゴリズムを提案します。
サンプリング時間とメモリ消費量を大幅に削減しながら、他の拡散ベースの教師なし異常検出アルゴリズムと比較して最先端のパフォーマンスを実現します。
コードは https://github.com/JuliaWolleb/Anomaly_berdiff で入手できます。

要約(オリジナル)

The high performance of denoising diffusion models for image generation has paved the way for their application in unsupervised medical anomaly detection. As diffusion-based methods require a lot of GPU memory and have long sampling times, we present a novel and fast unsupervised anomaly detection approach based on latent Bernoulli diffusion models. We first apply an autoencoder to compress the input images into a binary latent representation. Next, a diffusion model that follows a Bernoulli noise schedule is employed to this latent space and trained to restore binary latent representations from perturbed ones. The binary nature of this diffusion model allows us to identify entries in the latent space that have a high probability of flipping their binary code during the denoising process, which indicates out-of-distribution data. We propose a masking algorithm based on these probabilities, which improves the anomaly detection scores. We achieve state-of-the-art performance compared to other diffusion-based unsupervised anomaly detection algorithms while significantly reducing sampling time and memory consumption. The code is available at https://github.com/JuliaWolleb/Anomaly_berdiff.

arxiv情報

著者 Julia Wolleb,Florentin Bieder,Paul Friedrich,Peter Zhang,Alicia Durrer,Philippe C. Cattin
発行日 2024-03-18 11:15:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク