Neural interval-censored survival regression with feature selection

要約

生存分析は、生物医学研究、特に個別化医療の文脈において重点が置かれている基本的な分野です。
この顕著さは、オミクスや医療画像データなどの大規模かつ高次元のデータセットの普及が進んでいることによるものです。
ただし、非線形回帰アルゴリズムと間隔打ち切りのための変数選択技術に関する文献は、特にニューラル ネットワークの文脈では限られているか、存在しません。
私たちの目的は、加速故障時間 (AFT) モデルに基づいた、間隔打ち切り回帰タスクに合わせた新しい予測フレームワークを導入することです。
私たちの戦略は 2 つの主要なコンポーネントで構成されます。i) スパース ニューラル ネットワーク アーキテクチャの最近の進歩を活用した変数選択フェーズ、ii) 区間打ち切り応答の予測を対象とした回帰モデル。
新しいアルゴリズムのパフォーマンスを評価するために、糖尿病と身体活動に関連するシナリオを含む数値実験と現実世界のアプリケーションの両方を通じて包括的な評価を実施しました。
私たちの結果は、特に非線形関係を特徴とするシナリオにおいて、従来の AFT アルゴリズムよりも優れたパフォーマンスを発揮します。

要約(オリジナル)

Survival analysis is a fundamental area of focus in biomedical research, particularly in the context of personalized medicine. This prominence is due to the increasing prevalence of large and high-dimensional datasets, such as omics and medical image data. However, the literature on non-linear regression algorithms and variable selection techniques for interval-censoring is either limited or non-existent, particularly in the context of neural networks. Our objective is to introduce a novel predictive framework tailored for interval-censored regression tasks, rooted in Accelerated Failure Time (AFT) models. Our strategy comprises two key components: i) a variable selection phase leveraging recent advances on sparse neural network architectures, ii) a regression model targeting prediction of the interval-censored response. To assess the performance of our novel algorithm, we conducted a comprehensive evaluation through both numerical experiments and real-world applications that encompass scenarios related to diabetes and physical activity. Our results outperform traditional AFT algorithms, particularly in scenarios featuring non-linear relationships.

arxiv情報

著者 Carlos García Meixide,Marcos Matabuena,Louis Abraham,Michael R. Kosorok
発行日 2024-08-22 16:48:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク