要約
疾患遺伝子の優先順位付けでは、提供されたシード遺伝子のセットに基づいて、特定の疾患との関連性の可能性に従って遺伝子またはタンパク質にスコアを割り当てます。
ここでは、タンパク質間相互作用 (PPI) ネットワークの隣接行列を使用した、連続時間量子ウォークに基づく疾患遺伝子の優先順位付けのための新しいアルゴリズムについて説明します。
私たちのアルゴリズムは、拡散カーネルとして知られる以前の方法の量子バージョンと見なすことができますが、重要なことに、疾患遺伝子の予測においてより高いパフォーマンスを備えており、シード ノードの自己ループを基礎となるハミルトニアンにエンコードすることも可能です。
さらなるパフォーマンスの向上。
我々は、7 つの異なる PPI ネットワークにわたる 3 つの疾患セットに対するいくつかのよく知られた遺伝子優先順位付け方法と比較することにより、提案した方法の成功を実証します。
これらの方法を比較するために、交差検証を使用し、平均相互順位と再現率を調べます。
さらに、冠状動脈疾患の予測遺伝子の濃縮分析を実行することで、この方法を検証します。
また、シードに自己ループを追加することの影響も調査し、自己ループを追加することで量子ウォーカーが低次数のシード ノードに対してより局所的に留まることが可能になると主張します。
要約(オリジナル)
Disease gene prioritization assigns scores to genes or proteins according to their likely relevance for a given disease based on a provided set of seed genes. Here, we describe a new algorithm for disease gene prioritization based on continuous-time quantum walks using the adjacency matrix of a protein-protein interaction (PPI) network. Our algorithm can be seen as a quantum version of a previous method known as the diffusion kernel, but, importantly, has higher performance in predicting disease genes, and also permits the encoding of seed node self-loops into the underlying Hamiltonian, which offers yet another boost in performance. We demonstrate the success of our proposed method by comparing it to several well-known gene prioritization methods on three disease sets, across seven different PPI networks. In order to compare these methods, we use cross-validation and examine the mean reciprocal ranks and recall values. We further validate our method by performing an enrichment analysis of the predicted genes for coronary artery disease. We also investigate the impact of adding self-loops to the seeds, and argue that they allow the quantum walker to remain more local to low-degree seed nodes.
arxiv情報
著者 | Harto Saarinen,Mark Goldsmith,Rui-Sheng Wang,Joseph Loscalzo,Sabrina Maniscalco |
発行日 | 2023-11-09 16:21:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google