Unsupervised Evolutionary Cell Type Matching via Entropy-Minimized Optimal Transport

要約

種全体の細胞タイプ間の進化的対応を特定することは、比較ゲノミクスと進化生物学の根本的な課題です。
既存のアプローチは、多くの場合、参照ベースの一致のいずれかに依存しています。これは、1つの種を参照として指定することにより非対称性を課します。または、細胞型レベルでの計算の複雑さと不明瞭な生物学的解釈可能性を高める可能性があります。
ここでは、エントロピー正規化最適輸送(OT)を活用する監視なしの計算フレームワークであるOT-Meshを提示して、異種の細胞型のホモロジーを体系的に決定します。
私たちの方法は、Sinkhorn(Mesh)技術の最小化エントロピーを独自に統合して、OT計画を改良します。
これは、高い信号対雑音比(SNR)の遺伝子を選択して、最も有益な機能をキャプチャすることから始まります。そこからコストマトリックスは、細胞型重心のコサイン距離を使用して構築されます。
重要なことに、メッシュの手順はコストマトリックスを繰り返し洗練し、結果として得られる対応マトリックスのスパース性と解釈可能性を大幅に向上させる輸送計画につながります。
マウスとマカクの網膜双極細胞(BC)および網膜神経節細胞(RGC)に適用され、OT-Meshは既知の進化関係を正確に回復し、新しい対応を明らかにしました。
したがって、私たちのフレームワークは、進化細胞型マッピングのための原則的でスケーラブルで対称的で解釈可能な解決策を提供し、種全体の細胞の専門化と保全に関するより深い洞察を促進します。

要約(オリジナル)

Identifying evolutionary correspondences between cell types across species is a fundamental challenge in comparative genomics and evolutionary biology. Existing approaches often rely on either reference-based matching, which imposes asymmetry by designating one species as the reference, or projection-based matching, which may increase computational complexity and obscure biological interpretability at the cell-type level. Here, we present OT-MESH, an unsupervised computational framework leveraging entropy-regularized optimal transport (OT) to systematically determine cross-species cell type homologies. Our method uniquely integrates the Minimize Entropy of Sinkhorn (MESH) technique to refine the OT plan. It begins by selecting genes with high Signal-to-Noise Ratio (SNR) to capture the most informative features, from which a cost matrix is constructed using cosine distances between cell-type centroids. Importantly, the MESH procedure iteratively refines the cost matrix, leading to a transport plan with significantly enhanced sparsity and interpretability of the resulting correspondence matrices. Applied to retinal bipolar cells (BCs) and retinal ganglion cells (RGCs) from mouse and macaque, OT-MESH accurately recovers known evolutionary relationships and uncovers novel correspondences, one of which was independently validated experimentally. Thus, our framework offers a principled, scalable, symmetric, and interpretable solution for evolutionary cell type mapping, facilitating deeper insights into cellular specialization and conservation across species.

arxiv情報

著者 Mu Qiao
発行日 2025-05-30 16:20:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.QM パーマリンク