要約
医学研究の多くの分野と同様に、生存分析では、複雑、高次元、異種、不完全、検閲済みの医療データをモデル化するための深層学習技術の適用に対する関心が高まっています。
現在の方法では、実際には有効ではない可能性のあるデータ間の関係について仮定を行うことがよくあります。
これに応えて、変分オートエンコーダーに基づく新しいアプローチである SAVAE (生存分析変分オートエンコーダー) を紹介します。
SAVAE は、生存分析用にカスタマイズされた ELBO 定式化を導入し、共変量と生存時間のさまざまなパラメトリック分布 (対数尤度が微分可能である限り) をサポートすることで、この分野に大きく貢献しています。
これは、さまざまな測定基準で一貫して優れたパフォーマンスを発揮する一般的な方法を提供し、さまざまな実験を通じて堅牢性と安定性を実証します。
私たちの提案は、打ち切り、共変量相互作用、および時間変化するリスク関連性を考慮して、イベント発生までの時間を効果的に推定します。
私たちは、ゲノムデータ、臨床データ、人口統計データなどの多様なデータセットで、さまざまなレベルの打ち切りを使用してモデルを検証します。
このアプローチは、一致指数と統合ブリエ スコアによって評価されるように、最先端の技術と比較して競争力のあるパフォーマンスを示します。
SAVAE は、共変量と時間をパラメトリックにモデル化する解釈可能なモデルも提供します。
さらに、その生成アーキテクチャにより、クラスタリング、データ補完、生存データからの潜在空間推論による合成患者データの生成などのさらなるアプリケーションが容易になります。
要約(オリジナル)
As in many fields of medical research, survival analysis has witnessed a growing interest in the application of deep learning techniques to model complex, high-dimensional, heterogeneous, incomplete, and censored medical data. Current methods often make assumptions about the relations between data that may not be valid in practice. In response, we introduce SAVAE (Survival Analysis Variational Autoencoder), a novel approach based on Variational Autoencoders. SAVAE contributes significantly to the field by introducing a tailored ELBO formulation for survival analysis, supporting various parametric distributions for covariates and survival time (as long as the log-likelihood is differentiable). It offers a general method that consistently performs well on various metrics, demonstrating robustness and stability through different experiments. Our proposal effectively estimates time-to-event, accounting for censoring, covariate interactions, and time-varying risk associations. We validate our model in diverse datasets, including genomic, clinical, and demographic data, with varying levels of censoring. This approach demonstrates competitive performance compared to state-of-the-art techniques, as assessed by the Concordance Index and the Integrated Brier Score. SAVAE also offers an interpretable model that parametrically models covariates and time. Moreover, its generative architecture facilitates further applications such as clustering, data imputation, and the generation of synthetic patient data through latent space inference from survival data.
arxiv情報
著者 | Patricia A. Apellániz,Juan Parras,Santiago Zazo |
発行日 | 2023-12-22 12:36:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google