要約
放射線診断に関連する患者ケアの質は、医師の作業負荷に比例します。
セグメンテーションは、診断手順と治療手順の両方を制限する基本的な前兆です。
機械学習 (ML) の進歩は、単一のアプリケーションを一般化されたアルゴリズムに置き換えることで診断効率を高めることを目的としています。
教師なし異常検出 (UAD) の目標は、トレーニング中に見えない潜在的な異常領域を特定することです。この場合、畳み込みニューラル ネットワーク (CNN) ベースのオートエンコーダー (AE) と変分オートエンコーダー (VAE) は、再構成ベースの異常セグメンテーションの事実上のアプローチと見なされます。
CNN の制限された受容野は、グローバル コンテキストをモデル化するために CNN を制限します。
したがって、異常な領域が画像の大部分を覆っている場合、CNN ベースの AE は画像のセマンティックな理解をもたらすことができません。
一方、ビジョン トランスフォーマー (ViT) は、CNN に代わる競争力のある代替手段として登場しました。
これは、画像パッチを相互に関連付けることができる自己注意メカニズムに依存しています。
このホワイト ペーパーでは、再構成ベースの UAD タスクの AE を構築して、コヒーレントでよりリアルな画像を再構成するトランスフォーマーの機能を調査します。
脳磁気共鳴画像法 (MRI) の異常セグメンテーションに焦点を当て、最先端 (SOTA) モデルと同等またはそれ以上のセグメンテーション パフォーマンスを実現しながら、5 つのトランスフォーマー ベースのモデルを提示します。
ソース コードは GitHub (https://github.com/ahmedgh970/Transformers_Unsupervised_Anomaly_Segmentation.git) で公開されています。
要約(オリジナル)
The quality of patient care associated with diagnostic radiology is proportionate to a physician workload. Segmentation is a fundamental limiting precursor to both diagnostic and therapeutic procedures. Advances in machine learning (ML) aim to increase diagnostic efficiency by replacing a single application with generalized algorithms. The goal of unsupervised anomaly detection (UAD) is to identify potential anomalous regions unseen during training, where convolutional neural network (CNN) based autoencoders (AEs) and variational autoencoders (VAEs) are considered a de facto approach for reconstruction based-anomaly segmentation. The restricted receptive field in CNNs limits the CNN to model the global context. Hence, if the anomalous regions cover large parts of the image, the CNN-based AEs are not capable of bringing a semantic understanding of the image. Meanwhile, vision transformers (ViTs) have emerged as a competitive alternative to CNNs. It relies on the self-attention mechanism that can relate image patches to each other. We investigate in this paper Transformer capabilities in building AEs for the reconstruction-based UAD task to reconstruct a coherent and more realistic image. We focus on anomaly segmentation for brain magnetic resonance imaging (MRI) and present five Transformer-based models while enabling segmentation performance comparable to or superior to state-of-the-art (SOTA) models. The source code is made publicly available on GitHub: https://github.com/ahmedgh970/Transformers_Unsupervised_Anomaly_Segmentation.git.
arxiv情報
著者 | Ahmed Ghorbel,Ahmed Aldahdooh,Shadi Albarqouni,Wassim Hamidouche |
発行日 | 2022-08-29 11:37:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google