Extrapolating Prospective Glaucoma Fundus Images through Diffusion Model in Irregular Longitudinal Sequences

要約

緑内障進行予測のための縦断的データセットの利用は、早期の治療介入をサポートする魅力的なアプローチを提供します。
この分野の主な方法論は、主に縦断データセットから緑内障病期ラベルを直接予測することに焦点を当ててきました。
しかし、そのような方法では、この疾患の微妙な発達の軌跡を適切に要約できない可能性があります。
医師の診断洞察力を高めるために、患者の既存の縦断眼底画像から外挿することで将来の画像を予測する新しい拡散ベースのモデルを提案します。
この研究で概説された方法論は、入力として一連の画像を独特に活用しています。
その後、時間調整されたマスクを使用して、画像生成のための特定の年が選択されます。
トレーニング段階では、時間調整されたマスクにより、縦方向の画像シーケンスのサンプリングにおける不規則な時間間隔の問題が解決されます。
さらに、シーケンス内のフレームをランダムにマスクする戦略を利用して、グランド トゥルースを確立します。
この方法論は、ネットワークが学習フェーズを通じてシーケンス間の内部関係に関する知識を継続的に取得するのに役立ちます。
さらに、テキストラベルの導入は、シーケンス内で生成された画像を分類するのに役立ちます。
実施された実験からの経験的結果は、私たちが提案したモデルが縦断データを効果的に生成するだけでなく、下流の分類タスクの精度を大幅に向上させることを示しています。

要約(オリジナル)

The utilization of longitudinal datasets for glaucoma progression prediction offers a compelling approach to support early therapeutic interventions. Predominant methodologies in this domain have primarily focused on the direct prediction of glaucoma stage labels from longitudinal datasets. However, such methods may not adequately encapsulate the nuanced developmental trajectory of the disease. To enhance the diagnostic acumen of medical practitioners, we propose a novel diffusion-based model to predict prospective images by extrapolating from existing longitudinal fundus images of patients. The methodology delineated in this study distinctively leverages sequences of images as inputs. Subsequently, a time-aligned mask is employed to select a specific year for image generation. During the training phase, the time-aligned mask resolves the issue of irregular temporal intervals in longitudinal image sequence sampling. Additionally, we utilize a strategy of randomly masking a frame in the sequence to establish the ground truth. This methodology aids the network in continuously acquiring knowledge regarding the internal relationships among the sequences throughout the learning phase. Moreover, the introduction of textual labels is instrumental in categorizing images generated within the sequence. The empirical findings from the conducted experiments indicate that our proposed model not only effectively generates longitudinal data but also significantly improves the precision of downstream classification tasks.

arxiv情報

著者 Zhihao Zhao,Junjie Yang,Shahrooz Faghihroohi,Yinzheng Zhao,Daniel Zapp,Kai Huang,Nassir Navab,M. Ali Nasseri
発行日 2024-10-28 15:31:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク