A Goemans-Williamson type algorithm for identifying subcohorts in clinical trials

要約

大きな不均一データセットから均質なサブセット(同等にサブコホート)を識別するための線形分類器を出力する効率的なアルゴリズムを設計します。
私たちの理論的貢献は、Goemans and Williamson(1994)のそれと同様の丸みを帯びた手法であり、0.82ドルの係数内の基礎となる最適化問題の最適な解を近似しています。
アプリケーションとして、私たちのアルゴリズムを使用して、Curtis et al。による乳がんのRNAマイクロアレイデータセットから、主に転移性症例で構成される患者の均質なサブコホートを識別できる簡単なテストを設計します。
(2012)。
さらに、アルゴリズムによる試験出力も使用して、腫瘍抑制遺伝子のメチル化レベルの統計的に有意な変化が核受容体発現の統計的に有意な変化と共存する患者のサブホートを体系的に識別します。
患者のこのような均質なサブホートを特定することは、疾患経路と治療薬の発見に役立つ可能性があります。

要約(オリジナル)

We design an efficient algorithm that outputs a linear classifier for identifying homogeneous subsets (equivalently subcohorts) from large inhomogeneous datasets. Our theoretical contribution is a rounding technique, similar to that of Goemans and Williamson (1994), that approximates the optimal solution of the underlying optimization problem within a factor of $0.82$. As an application, we use our algorithm to design a simple test that can identify homogeneous subcohorts of patients, that are mainly comprised of metastatic cases, from the RNA microarray dataset for breast cancer by Curtis et al. (2012). Furthermore, we also use the test output by the algorithm to systematically identify subcohorts of patients in which statistically significant changes in methylation levels of tumor suppressor genes co-occur with statistically significant changes in nuclear receptor expression. Identifying such homogeneous subcohorts of patients can be useful for the discovery of disease pathways and therapeutics, specific to the subcohort.

arxiv情報

著者 Pratik Worah
発行日 2025-06-12 16:44:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.QM パーマリンク