Domain-Adversarial Neural Network and Explainable AI for Reducing Tissue-of-Origin Signal in Pan-cancer Mortality Classification

要約

組織のオリジンシグナルは、汎癌遺伝子発現を支配し、患者の生存に関連する分子的特徴を曖昧にすることがよくあります。
モデルは生存に関連するシグナルをキャプチャするのではなく、組織固有のパターンに過剰に採用する傾向があるため、一般化可能なバイオマーカーの発見を妨げます。
これに対処するために、TCGA RNA-seqデータで訓練されたドメイン副産物ニューラルネットワーク(DANN)を提案して、組織に偏りが少なく生存に焦点を当てた表現を学習します。
組織に依存しない遺伝的プロファイルを特定することは、コアがんプログラムを明らかにするための鍵です。
以下を使用してDANNを評価します。(1)元の入力スペースとDannの死亡率分類器に基づいて、標準shap。
(2)生の活性化からの監視なしマニホールドや、死亡率固有のSHAP値からの監視された多様体など、隠された活性化に適用される層認識戦略。
標準的な整形は、その計算に固有のバイアスのため、組織信号によって混乱したままです。
生の活性化マニホールドは、微妙な組織と死亡関連信号を隠す高マグニチュードの活性化によって支配されていました。
対照的に、層を認識したSHAPマニホールドは、活性化強度とは無関係に、組織と死亡率の両方の低次元表現を改善し、亜集団層別化と生存関連遺伝子の汎キャンサーの同定を可能にします。

要約(オリジナル)

Tissue-of-origin signals dominate pan-cancer gene expression, often obscuring molecular features linked to patient survival. This hampers the discovery of generalizable biomarkers, as models tend to overfit tissue-specific patterns rather than capture survival-relevant signals. To address this, we propose a Domain-Adversarial Neural Network (DANN) trained on TCGA RNA-seq data to learn representations less biased by tissue and more focused on survival. Identifying tissue-independent genetic profiles is key to revealing core cancer programs. We assess the DANN using: (1) Standard SHAP, based on the original input space and DANN’s mortality classifier; (2) A layer-aware strategy applied to hidden activations, including an unsupervised manifold from raw activations and a supervised manifold from mortality-specific SHAP values. Standard SHAP remains confounded by tissue signals due to biases inherent in its computation. The raw activation manifold was dominated by high-magnitude activations, which masked subtle tissue and mortality-related signals. In contrast, the layer-aware SHAP manifold offers improved low-dimensional representations of both tissue and mortality signals, independent of activation strength, enabling subpopulation stratification and pan-cancer identification of survival-associated genes.

arxiv情報

著者 Cristian Padron-Manrique,Juan José Oropeza Valdez,Osbaldo Resendis-Antonio
発行日 2025-04-14 15:51:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.QM パーマリンク