要約
頭蓋内動脈瘤は、世界中の罹患率と死亡率の主な原因であり、それらを手動で検出することは、複雑で時間のかかる作業です。
自動化されたソリューションが望ましいものの、トレーニングデータの利用可能性が限られているため、典型的な監視された学習フレームワークを使用してこのようなソリューションを開発することは困難です。
この作業では、動脈瘤検出タスクを微調整する前に、より広く利用可能な未定のヘッドCTスキャンデータを使用して3D視力変圧器モデルを事前にトレーニングするための新しいトレーニング前戦略を提案します。
具体的には、マスクされた自動エンコーダー(MAE)の事前トレーニングを次の方法で変更します。3D注意を計算可能にするために因数分解された自己触媒メカニズムを使用して、動脈瘤が発生する可能性が高い地域に焦点を当てるために、マスクされたパッチを動脈近くのエリアに制限し、それぞれの距離を記述するだけでなく、耐久性の距離を記述します。
それにより、バックボーンの学習表現を強化します。
SOTA動脈瘤検出モデルと比較して、私たちのアプローチは、0.5の誤検知速度で4〜8%の絶対感度を獲得します。
コードと重みがリリースされます。
要約(オリジナル)
Intracranial aneurysms are a major cause of morbidity and mortality worldwide, and detecting them manually is a complex, time-consuming task. Albeit automated solutions are desirable, the limited availability of training data makes it difficult to develop such solutions using typical supervised learning frameworks. In this work, we propose a novel pre-training strategy using more widely available unannotated head CT scan data to pre-train a 3D Vision Transformer model prior to fine-tuning for the aneurysm detection task. Specifically, we modify masked auto-encoder (MAE) pre-training in the following ways: we use a factorized self-attention mechanism to make 3D attention computationally viable, we restrict the masked patches to areas near arteries to focus on areas where aneurysms are likely to occur, and we reconstruct not only CT scan intensity values but also artery distance maps, which describe the distance between each voxel and the closest artery, thereby enhancing the backbone’s learned representations. Compared with SOTA aneurysm detection models, our approach gains +4-8% absolute Sensitivity at a false positive rate of 0.5. Code and weights will be released.
arxiv情報
| 著者 | Alberto Mario Ceballos-Arroyo,Jisoo Kim,Chu-Hsuan Lin,Lei Qin,Geoffrey S. Young,Huaizu Jiang |
| 発行日 | 2025-02-28 17:13:58+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google