Variational Bayesian Phylogenetic Inference with Semi-implicit Branch Length Distributions

要約

分子配列の集合に関連する進化の歴史を再構成することは、現代のベイズ系統推論の主要な主題です。
ただし、一般的に使用されるマルコフ連鎖モンテカルロ法は、特に配列数が多い場合、系統樹の空間が複雑なため非効率になる可能性があります。
別のアプローチは、推論問題を最適化問題に変換する変分ベイズ系統推論 (VBPI) です。
VBPI で使用されるツリーの枝の長さのデフォルトの対角対数正規近似は効果的ではありますが、多くの場合、正確な事後分布の複雑さを捉えるには不十分です。
この研究では、グラフ ニューラル ネットワークを使用した半陰的階層分布に基づいた、より柔軟な分岐長変分事後分布群を提案します。
この半陰的構築は直接的な置換等変分布を生成するため、異なるツリー トポロジにわたる非ユークリッド分岐長空間を簡単に処理できることを示します。
半陰的変分分布の手に負えない限界確率に対処するために、確率的最適化のためのいくつかの代替下限を開発しました。
周辺尤度推定と分岐長事後近似の両方の観点から、ベンチマーク データの例でベースライン手法に対する提案手法の有効性を実証します。

要約(オリジナル)

Reconstructing the evolutionary history relating a collection of molecular sequences is the main subject of modern Bayesian phylogenetic inference. However, the commonly used Markov chain Monte Carlo methods can be inefficient due to the complicated space of phylogenetic trees, especially when the number of sequences is large. An alternative approach is variational Bayesian phylogenetic inference (VBPI) which transforms the inference problem into an optimization problem. While effective, the default diagonal lognormal approximation for the branch lengths of the tree used in VBPI is often insufficient to capture the complexity of the exact posterior. In this work, we propose a more flexible family of branch length variational posteriors based on semi-implicit hierarchical distributions using graph neural networks. We show that this semi-implicit construction emits straightforward permutation equivariant distributions, and therefore can handle the non-Euclidean branch length space across different tree topologies with ease. To deal with the intractable marginal probability of semi-implicit variational distributions, we develop several alternative lower bounds for stochastic optimization. We demonstrate the effectiveness of our proposed method over baseline methods on benchmark data examples, in terms of both marginal likelihood estimation and branch length posterior approximation.

arxiv情報

著者 Tianyu Xie,Frederick A. Matsen IV,Marc A. Suchard,Cheng Zhang
発行日 2024-08-09 13:29:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク