GeoPhy: Differentiable Phylogenetic Inference via Geometric Gradients of Tree Topologies

要約

分子進化モデルに基づいた系統推論は、生物学的データにおける進化の関係を理解するために不可欠です。
樹木のトポロジーや枝上の進化距離を含む系統樹の変数の不確実性を考慮することは、分子データから種の関係を正確に推測したり、変数の周辺化を必要とするタスクを行うために重要です。
変分ベイジアン手法は、スケーラブルで実用的なモデルを開発するための鍵となります。
ただし、組み合わせ的に膨大な数の可能なツリー トポロジーを制限せずに系統推論を行うことは依然として困難です。
この研究では、連続的な幾何学的空間における位相分布の独自の表現を活用する系統推論の新規で完全に微分可能な定式化を導入します。
勾配推定のための設計空間と制御変数に関する実際的な考慮を通じて、私たちのアプローチである GeoPhy は、トポロジーの候補を制限することなく変分推論を可能にします。
実際のベンチマーク データセットを使用した実験では、GeoPhy はトポロジ全体を考慮した他の近似ベイジアン手法を大幅に上回りました。

要約(オリジナル)

Phylogenetic inference, grounded in molecular evolution models, is essential for understanding the evolutionary relationships in biological data. Accounting for the uncertainty of phylogenetic tree variables, which include tree topologies and evolutionary distances on branches, is crucial for accurately inferring species relationships from molecular data and tasks requiring variable marginalization. Variational Bayesian methods are key to developing scalable, practical models; however, it remains challenging to conduct phylogenetic inference without restricting the combinatorially vast number of possible tree topologies. In this work, we introduce a novel, fully differentiable formulation of phylogenetic inference that leverages a unique representation of topological distributions in continuous geometric spaces. Through practical considerations on design spaces and control variates for gradient estimations, our approach, GeoPhy, enables variational inference without limiting the topological candidates. In experiments using real benchmark datasets, GeoPhy significantly outperformed other approximate Bayesian methods that considered whole topologies.

arxiv情報

著者 Takahiro Mimori,Michiaki Hamada
発行日 2023-07-07 15:45:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.PE, stat.ML パーマリンク