OmicsCL: Unsupervised Contrastive Learning for Cancer Subtype Discovery and Survival Stratification

要約

マルチオミクスデータからの病気のサブタイプの監視されていない学習は、個別化医療を進めるための重要な機会を提供します。
OMICSCLを紹介します。これは、遺伝子発現、DNAメチル化、およびmiRNA発現など、不均一なOMICSモダリティなどを共同で組み合わせて統一された潜在空間に共同で埋め込むモジュラーコントラスト学習フレームワークを紹介します。
私たちの方法には、ラベルの付いた結果に依存せずに、生存関連のパターンと整合した表現を学習することをモデルが促進する生存対象の対照的な損失が組み込まれています。
TCGA BRCAデータセットで評価されたOMICSCLは、臨床的に意味のあるクラスターを明らかにし、患者の生存と強い監視されていない一致を達成します。
フレームワークは、ハイパーパラメーター構成全体の堅牢性を示し、サブタイプのコヒーレンスまたは生存層のいずれかを優先順位付けするように調整できます。
アブレーション研究は、生存とアウェアの損失を統合することで、学習埋め込みの予測力が大幅に向上することを確認しています。
これらの結果は、高次元の不均一なOMICSデータにおける生物学的洞察の発見の対照的な目的の約束を強調しています。

要約(オリジナル)

Unsupervised learning of disease subtypes from multi-omics data presents a significant opportunity for advancing personalized medicine. We introduce OmicsCL, a modular contrastive learning framework that jointly embeds heterogeneous omics modalities-such as gene expression, DNA methylation, and miRNA expression-into a unified latent space. Our method incorporates a survival-aware contrastive loss that encourages the model to learn representations aligned with survival-related patterns, without relying on labeled outcomes. Evaluated on the TCGA BRCA dataset, OmicsCL uncovers clinically meaningful clusters and achieves strong unsupervised concordance with patient survival. The framework demonstrates robustness across hyperparameter configurations and can be tuned to prioritize either subtype coherence or survival stratification. Ablation studies confirm that integrating survival-aware loss significantly enhances the predictive power of learned embeddings. These results highlight the promise of contrastive objectives for biological insight discovery in high-dimensional, heterogeneous omics data.

arxiv情報

著者 Atahan Karagoz
発行日 2025-05-01 16:51:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.GN, q-bio.QM パーマリンク