Multi-Source Survival Domain Adaptation

要約

生存分析とは、統計学の一分野であり、打ち切られた事例が持つ部分的な情報を考慮しながら、生命体の特性とそれぞれの生存時間との関係を研究するものである。優れた解析は、例えば、ある患者グループに対するある医療処置が他の医療処置よりも優れているかどうかを判断することができます。機械学習の台頭により、生存時間分析は、調査した患者と生存時間を対応付ける関数を学習することでモデル化できるようになりました。それを成功させるためには、3つの重要な問題があります。第一に、患者データの中には打ち切られたものがあり、すべての患者の本当の生存時間がわからない。第二に、データが少ないため、過去の研究では、異なる病気の種類をドメインとして扱い、マルチタスクで設定することが行われてきた。第三に、ラベルがほとんどない、あるいは全くない、新しい、あるいは極めて稀な病型への適応が必要であることである。これまでのマルチタスクセットアップとは対照的に、我々は、複数の生存ソースドメインから新しい生存ターゲットドメインに効率的に適応する方法を研究したい。このために、我々は新しい生存指標とそれに対応する生存分布間の不一致尺度を導入する。これらにより、生存解析のためのドメイン適応を定義することができ、そうでなければ削除しなければならない打ち切りデータを取り込むことができる。2つのがんデータセットでの実験により、ターゲットドメインでの優れた性能、より良い治療法の推奨、そしてもっともらしい説明を持つ重み行列を明らかにした。

要約(オリジナル)

Survival analysis is the branch of statistics that studies the relation between the characteristics of living entities and their respective survival times, taking into account the partial information held by censored cases. A good analysis can, for example, determine whether one medical treatment for a group of patients is better than another. With the rise of machine learning, survival analysis can be modeled as learning a function that maps studied patients to their survival times. To succeed with that, there are three crucial issues to be tackled. First, some patient data is censored: we do not know the true survival times for all patients. Second, data is scarce, which led past research to treat different illness types as domains in a multi-task setup. Third, there is the need for adaptation to new or extremely rare illness types, where little or no labels are available. In contrast to previous multi-task setups, we want to investigate how to efficiently adapt to a new survival target domain from multiple survival source domains. For this, we introduce a new survival metric and the corresponding discrepancy measure between survival distributions. These allow us to define domain adaptation for survival analysis while incorporating censored data, which would otherwise have to be dropped. Our experiments on two cancer data sets reveal a superb performance on target domains, a better treatment recommendation, and a weight matrix with a plausible explanation.

arxiv情報

著者 Ammar Shaker,Carolin Lawrence
発行日 2023-03-06 16:00:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク