A Deep Learning Approach for Overall Survival Prediction in Lung Cancer with Missing Values

要約

人工知能 (AI) を適用できる最も困難な分野の 1 つは、肺がん研究、特に非小細胞肺がん (NSCLC) です。
特に、診断から死亡までの期間である全生存期間 (OS) は、患者の状態を示す重要な指標であり、カスタマイズされた治療と OS 率の向上を可能にします。
この分析では、考慮すべき 2 つの課題があります。
まず、イベントの時間も考慮して、検閲されていない(つまり死亡した)患者と検閲された(つまり生存者)患者の両方を活用して、各患者から得られる情報を効果的に利用している研究はほとんどありません。
2 番目に、不完全なデータの処理は医療分野でよくある問題です。
この問題は通常、代入手法を使用して解決されます。
私たちの目的は、NSCLC 患者の OS を予測するために、これらの限界を克服できる AI モデルを提示し、検閲された患者と検閲されていない患者の両方とその利用可能な特徴から効果的に学習することです。
我々は、NSCLC のコンテキストで欠損値を使用した生存分析に対する新しいアプローチを提案します。これは、代入戦略を必要とせずに、利用可能な特徴のみを考慮するトランスフォーマー アーキテクチャの強みを活用します。
OS のアドホック損失を利用することで、検閲された患者と検閲されていない患者の両方、および時間の経過に伴うリスクの変化を考慮することができます。
私たちは、さまざまな代入戦略を組み合わせた生存分析のための最先端のモデルと私たちの方法を比較しました。
さまざまな時間粒度を使用して 6 年間にわたって得られた結果を評価し、1 か月、1 年、および 2 年の時間単位で 71.97、77.58、および 80.72 の C インデックス (C インデックスの時間依存バリアント) を取得しました。
、それぞれ、使用される代入方法に関係なく、すべての最先端の方法を上回ります。

要約(オリジナル)

One of the most challenging fields where Artificial Intelligence (AI) can be applied is lung cancer research, specifically non-small cell lung cancer (NSCLC). In particular, overall survival (OS), the time between diagnosis and death, is a vital indicator of patient status, enabling tailored treatment and improved OS rates. In this analysis, there are two challenges to take into account. First, few studies effectively exploit the information available from each patient, leveraging both uncensored (i.e., dead) and censored (i.e., survivors) patients, considering also the events’ time. Second, the handling of incomplete data is a common issue in the medical field. This problem is typically tackled through the use of imputation methods. Our objective is to present an AI model able to overcome these limits, effectively learning from both censored and uncensored patients and their available features, for the prediction of OS for NSCLC patients. We present a novel approach to survival analysis with missing values in the context of NSCLC, which exploits the strengths of the transformer architecture to account only for available features without requiring any imputation strategy. By making use of ad-hoc losses for OS, it is able to account for both censored and uncensored patients, as well as changes in risks over time. We compared our method with state-of-the-art models for survival analysis coupled with different imputation strategies. We evaluated the results obtained over a period of 6 years using different time granularities obtaining a Ct-index, a time-dependent variant of the C-index, of 71.97, 77.58 and 80.72 for time units of 1 month, 1 year and 2 years, respectively, outperforming all state-of-the-art methods regardless of the imputation method used.

arxiv情報

著者 Camillo Maria Caruso,Valerio Guarrasi,Sara Ramella,Paolo Soda
発行日 2023-07-28 10:20:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.AP パーマリンク