UGCANet: A Unified Global Context-Aware Transformer-based Network with Feature Alignment for Endoscopic Image Analysis

要約

消化管内視鏡検査は、カメラやその他の器具を備えた柔軟なチューブを使用して消化管を検査する医療処置です。
この低侵襲技術により、炎症性腸疾患、胃腸出血、結腸がんなどのさまざまな胃腸疾患の診断と管理が可能になります。
上部消化管の病変の早期検出と同定、および癌発生のリスクを引き起こす可能性のある悪性ポリープの同定は、消化管内視鏡検査の診断および治療用途の重要な要素です。
したがって、胃腸障害の検出率を高めると、タイムリーな医療介入の可能性が高まり、患者の予後が大幅に改善され、患者の寿命が延び、全体的な健康状態が改善される可能性があります。
この論文では、複数のタスクを同時に実行するように設計された、新しい Transformer ベースのディープ ニューラル ネットワークを紹介します。これにより、上部消化管病変と結腸ポリープの両方を正確に識別できるようになります。
私たちのアプローチは、独自のグローバル コンテキスト認識モジュールを提案し、強力な MiT バックボーンと機能アライメント ブロックを活用して、ネットワークの表現機能を強化します。
この斬新な設計により、さまざまな内視鏡診断タスクのパフォーマンスが大幅に向上します。
広範な実験により、他の最先端のアプローチと比較して、私たちの方法の優れたパフォーマンスが実証されています。

要約(オリジナル)

Gastrointestinal endoscopy is a medical procedure that utilizes a flexible tube equipped with a camera and other instruments to examine the digestive tract. This minimally invasive technique allows for diagnosing and managing various gastrointestinal conditions, including inflammatory bowel disease, gastrointestinal bleeding, and colon cancer. The early detection and identification of lesions in the upper gastrointestinal tract and the identification of malignant polyps that may pose a risk of cancer development are critical components of gastrointestinal endoscopy’s diagnostic and therapeutic applications. Therefore, enhancing the detection rates of gastrointestinal disorders can significantly improve a patient’s prognosis by increasing the likelihood of timely medical intervention, which may prolong the patient’s lifespan and improve overall health outcomes. This paper presents a novel Transformer-based deep neural network designed to perform multiple tasks simultaneously, thereby enabling accurate identification of both upper gastrointestinal tract lesions and colon polyps. Our approach proposes a unique global context-aware module and leverages the powerful MiT backbone, along with a feature alignment block, to enhance the network’s representation capability. This novel design leads to a significant improvement in performance across various endoscopic diagnosis tasks. Extensive experiments demonstrate the superior performance of our method compared to other state-of-the-art approaches.

arxiv情報

著者 Pham Vu Hung,Nguyen Duy Manh,Nguyen Thi Oanh,Nguyen Thi Thuy,Dinh Viet Sang
発行日 2023-07-12 16:01:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク