A Deep Learning Approach for Overall Survival Analysis with Missing Values

要約

人工知能 (AI) を適用できる最も困難な分野の 1 つは、肺がん研究、特に非小細胞肺がん (NSCLC) です。
特に、全生存期間 (OS) は患者の状態を示す重要な指標であり、多様な生存確率を持つサブグループを特定するのに役立ち、カスタマイズされた治療と OS 率の向上を可能にします。
この分析では、考慮すべき 2 つの課題があります。
まず、死亡時刻も考慮して、検閲されていない(つまり死亡した)患者と検閲された(つまり生存者)患者の両方を活用して、各患者から得られる情報を効果的に利用している研究はほとんどありません。
2 番目に、不完全なデータの処理は医療分野でよくある問題です。
この問題は通常、代入手法を使用して解決されます。
私たちの目的は、NSCLC 患者の OS を予測するために、これらの限界を克服できる AI モデルを提示し、検閲された患者と検閲されていない患者の両方とその利用可能な特徴から効果的に学習することです。
我々は、NSCLC のコンテキストにおける生存分析への新しいアプローチを提案します。これは、代入戦略を必要とせずに、利用可能な機能のみを考慮する変圧器アーキテクチャの強みを活用します。
OS のアドホック損失を利用することで、時間の経過に伴うリスクを考慮して、検閲された患者と検閲されていない患者の両方を考慮します。
さまざまな時間粒度を使用して 6 年間にわたる結果を評価し、C インデックスの時間依存バリアントである Ct インデックスを取得しました。時間単位は 1 か月、1 年、2 年で、それぞれ 71.97、77.58、80.72 であり、使用する代入手法に関係なく、すべての最先端の手法を上回りました。

要約(オリジナル)

One of the most challenging fields where Artificial Intelligence (AI) can be applied is lung cancer research, specifically non-small cell lung cancer (NSCLC). In particular, overall survival (OS) is a vital indicator of patient status, helping to identify subgroups with diverse survival probabilities, enabling tailored treatment and improved OS rates. In this analysis, there are two challenges to take into account. First, few studies effectively exploit the information available from each patient, leveraging both uncensored (i.e., dead) and censored (i.e., survivors) patients, considering also the death times. Second, the handling of incomplete data is a common issue in the medical field. This problem is typically tackled through the use of imputation methods. Our objective is to present an AI model able to overcome these limits, effectively learning from both censored and uncensored patients and their available features, for the prediction of OS for NSCLC patients. We present a novel approach to survival analysis in the context of NSCLC, which exploits the strengths of the transformer architecture accounting for only available features without requiring any imputation strategy. By making use of ad-hoc losses for OS, it accounts for both censored and uncensored patients, considering risks over time. We evaluated the results over a period of 6 years using different time granularities obtaining a Ct-index, a time-dependent variant of the C-index, of 71.97, 77.58 and 80.72 for time units of 1 month, 1 year and 2 years, respectively, outperforming all state-of-the-art methods regardless of the imputation method used.

arxiv情報

著者 Camillo Maria Caruso,Valerio Guarrasi,Sara Ramella,Paolo Soda
発行日 2023-07-21 10:01:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.AP パーマリンク