AttentNet: Fully Convolutional 3D Attention for Lung Nodule Detection

要約

アテンション メカニズムの人気の高まりを背景に、スクイーズ アンド エキサイト (SE) や畳み込みブロック アテンション モジュール (CBAM) などの一般的な畳み込み (conv.) アテンション モデルが高価な多層認識 (MLP) レイヤーに依存していることがわかりました。
これらの MLP レイヤーにより計算の複雑さが大幅に増加するため、データの次元数と計算コストが高くなる 3D 画像コンテキストにはそのようなモデルを適用できなくなります。
3D 肺 CT スキャンなどの 3D 医療画像処理では、データ量が大きいため効率的な処理が重要です。
従来の 2D アテンションを 3D に一般化すると、計算負荷が増大し、3D タスク用のより効率的なアテンション メカニズムが求められます。
私たちは、3D コンテキストに完全な畳み込み (conv.) 注意を組み込む可能性を調査します。
2 つの 3D フルコンバージョンを紹介します。
注意ブロックを使用し、3D コンテキストでの有効性を実証します。
3D 肺結節検出に肺 CT スキャンを使用し、候補の提案と偽陽性 (FP) の削減という 2 つの段階のアンサンブルとして検出を実行する、CT 画像からの自動肺結節検出フレームワークである AttentNet を紹介します。
提案された 3D アテンション ブロックを一般的な 2D コンバージョンと比較します。
注意メソッドは 3D モジュールとセルフ アテンション ユニットに一般化されます。
FP 削減段階では、共同分析アプローチを使用して、さまざまなコンテキスト レベルから空間情報を集約します。
提案された完全変換の利点を実証するために、LUNA-16 肺結節検出データセットを使用します。
注意を使用しない場合のベースラインの一般的な肺結節検出方法と比較して、注意がブロックされます。
私たちの研究は、肺結節検出タスクで最先端の結果を達成することを目的としたものではなく、完全に conv を組み込む利点を実証することを目的としています。
3D コンテキスト内での注意。

要約(オリジナル)

Motivated by the increasing popularity of attention mechanisms, we observe that popular convolutional (conv.) attention models like Squeeze-and-Excite (SE) and Convolutional Block Attention Module (CBAM) rely on expensive multi-layer perception (MLP) layers. These MLP layers significantly increase computational complexity, making such models less applicable to 3D image contexts, where data dimensionality and computational costs are higher. In 3D medical imaging, such as 3D pulmonary CT scans, efficient processing is crucial due to the large data volume. Traditional 2D attention generalized to 3D increases the computational load, creating demand for more efficient attention mechanisms for 3D tasks. We investigate the possibility of incorporating fully convolutional (conv.) attention in 3D context. We present two 3D fully conv. attention blocks, demonstrating their effectiveness in 3D context. Using pulmonary CT scans for 3D lung nodule detection, we present AttentNet, an automated lung nodule detection framework from CT images, performing detection as an ensemble of two stages, candidate proposal and false positive (FP) reduction. We compare the proposed 3D attention blocks to popular 2D conv. attention methods generalized to 3D modules and to self-attention units. For the FP reduction stage, we also use a joint analysis approach to aggregate spatial information from different contextual levels. We use LUNA-16 lung nodule detection dataset to demonstrate the benefits of the proposed fully conv. attention blocks compared to baseline popular lung nodule detection methods when no attention is used. Our work does not aim at achieving state-of-the-art results in the lung nodule detection task, rather to demonstrate the benefits of incorporating fully conv. attention within a 3D context.

arxiv情報

著者 Majedaldein Almahasneh,Xianghua Xie,Adeline Paiement
発行日 2024-07-19 17:06:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク