Cross-Task Attention Network: Improving Multi-Task Learning for Medical Imaging Applications

要約

マルチタスク学習 (MTL) は、トレーニング中に複数のタスクからの情報を活用してモデルのパフォーマンスを向上させる、深層学習における強力なアプローチです。
医療画像処理において、MTL はさまざまなタスクを解決する大きな可能性を示しています。
ただし、医用画像処理における既存の MTL アーキテクチャでは、タスク間での情報共有が制限されており、MTL のパフォーマンス向上の可能性が低くなります。
この研究では、ピクセルレベルから画像レベルの予測まで、さまざまなタスクのタスク間インタラクションをより効果的に活用するための、新しいアテンションベースの MTL フレームワークを導入します。
具体的には、クロスタスク アテンション メカニズムを利用して、タスク間で対話することで情報を取り込むクロスタスク アテンション ネットワーク (CTAN) を提案します。
私たちは、さまざまな領域とタスクにまたがる 4 つの医療画像データセットで CTAN を検証しました。これには次のようなものがあります。 2 つの異なる標的がん (前立腺、OpenKBP) の計画 CT 画像を使用した放射線治療計画の予測。
皮膚鏡画像 (HAM10000) を使用した色素沈着皮膚病変のセグメンテーションと診断。
胸部CTスキャン(STOIC)を使用した新型コロナウイルス感染症(COVID-19)の診断と重症度予測。
私たちの研究は、医療画像タスクの精度向上における CTAN の有効性を実証しています。
標準のシングルタスク学習 (STL) と比較して、CTAN はパフォーマンスで 4.67% の向上を示し、広く使用されている MTL ベースラインの両方を上回りました。ハード パラメーター共有 (HPS) では平均パフォーマンスが 3.22% 向上しました。
マルチタスク アテンション ネットワーク (MTAN) は相対的に 5.38% 減少しました。
これらの発見は、医用画像タスクを解決する上で私たちが提案する MTL フレームワークの重要性と、ドメイン全体で精度を向上させる可能性を強調しています。

要約(オリジナル)

Multi-task learning (MTL) is a powerful approach in deep learning that leverages the information from multiple tasks during training to improve model performance. In medical imaging, MTL has shown great potential to solve various tasks. However, existing MTL architectures in medical imaging are limited in sharing information across tasks, reducing the potential performance improvements of MTL. In this study, we introduce a novel attention-based MTL framework to better leverage inter-task interactions for various tasks from pixel-level to image-level predictions. Specifically, we propose a Cross-Task Attention Network (CTAN) which utilizes cross-task attention mechanisms to incorporate information by interacting across tasks. We validated CTAN on four medical imaging datasets that span different domains and tasks including: radiation treatment planning prediction using planning CT images of two different target cancers (Prostate, OpenKBP); pigmented skin lesion segmentation and diagnosis using dermatoscopic images (HAM10000); and COVID-19 diagnosis and severity prediction using chest CT scans (STOIC). Our study demonstrates the effectiveness of CTAN in improving the accuracy of medical imaging tasks. Compared to standard single-task learning (STL), CTAN demonstrated a 4.67% improvement in performance and outperformed both widely used MTL baselines: hard parameter sharing (HPS) with an average performance improvement of 3.22%; and multi-task attention network (MTAN) with a relative decrease of 5.38%. These findings highlight the significance of our proposed MTL framework in solving medical imaging tasks and its potential to improve their accuracy across domains.

arxiv情報

著者 Sangwook Kim,Thomas G. Purdie,Chris McIntosh
発行日 2023-09-07 16:50:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク