TripleSurv: Triplet Time-adaptive Coordinate Loss for Survival Analysis

要約

生存分析における中心的な課題は、関心のあるイベントが死亡、故障、または特定のイベントの発生である可能性がある、検閲されたイベント発生までの時間データの分布をモデル化することです。
これまでの研究では、ランキングおよび最尤推定 (MLE) 損失関数が生存分析に広く使用されていることが示されています。
ただし、ランキングの損失は生存時間のランキングのみに焦点を当てており、正確な生存時間値に対するサンプルの潜在的な影響は考慮されていません。
さらに、MLE には制限がなく、外れ値 (検閲されたデータなど) が発生しやすいため、モデリングのパフォーマンスが低下する可能性があります。
学習プロセスの複雑さに対処し、貴重な生存時間値を活用するために、サンプルペア間の生存時間の差をランキングに導入することで適応調整を実現する、時間適応型座標損失関数 TripleSurv を提案します。これにより、モデルの効率化が促進されます。
ペアの相対リスクを定量的にランク付けし、最終的に予測の精度を高めます。
最も重要なことは、TripleSurv は、ペアの順序をランク付けすることでサンプル間の相対リスクを定量化することに熟達しており、時間間隔をトレードオフとして考慮して、サンプル分布に対するモデルの堅牢性を調整できることです。
私たちの TripleSurv は、3 つの現実世界の生存データセットと公開されている合成データセットに基づいて評価されます。
結果は、私たちの方法が最先端の方法よりも優れており、異なる検閲率でさまざまな洗練されたデータ分布をモデル化する際に優れたモデルパフォーマンスとロバスト性を示すことを示しています。
私たちのコードは承認され次第利用可能になります。

要約(オリジナル)

A core challenge in survival analysis is to model the distribution of censored time-to-event data, where the event of interest may be a death, failure, or occurrence of a specific event. Previous studies have showed that ranking and maximum likelihood estimation (MLE)loss functions are widely-used for survival analysis. However, ranking loss only focus on the ranking of survival time and does not consider potential effect of samples for exact survival time values. Furthermore, the MLE is unbounded and easily subject to outliers (e.g., censored data), which may cause poor performance of modeling. To handle the complexities of learning process and exploit valuable survival time values, we propose a time-adaptive coordinate loss function, TripleSurv, to achieve adaptive adjustments by introducing the differences in the survival time between sample pairs into the ranking, which can encourage the model to quantitatively rank relative risk of pairs, ultimately enhancing the accuracy of predictions. Most importantly, the TripleSurv is proficient in quantifying the relative risk between samples by ranking ordering of pairs, and consider the time interval as a trade-off to calibrate the robustness of model over sample distribution. Our TripleSurv is evaluated on three real-world survival datasets and a public synthetic dataset. The results show that our method outperforms the state-of-the-art methods and exhibits good model performance and robustness on modeling various sophisticated data distributions with different censor rates. Our code will be available upon acceptance.

arxiv情報

著者 Liwen Zhang,Lianzhen Zhong,Fan Yang,Di Dong,Hui Hui,Jie Tian
発行日 2024-01-05 08:37:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク