Hierarchical Sparse Bayesian Multitask Model with Scalable Inference for Microbiome Analysis

要約

本稿では、一般的なマルチタスク二分類学習問題に適用可能な、階層的ベイズ型マルチタスク学習モデルを提案する。事後分布を近似するための変分推論に基づく計算効率の良い推論アルゴリズムを導出する。我々は、様々な合成データセットを用いて、マイクロバイオームプロファイルに基づくヒトの健康状態の予測に対する新しいアプローチの可能性を実証する。我々の分析は、他のベンチマーク手法との包括的な比較とともに、複数のマイクロバイオーム研究からプールされたデータを組み込んでいる。合成データセットにおける結果は、基礎となる回帰係数が異なるタスク間で共通のスパース構造を共有する場合、提案アプローチが優れたサポート回復特性を持つことを示している。マイクロバイオーム分類に関する我々の実験は、不確実性を定量化した上で十分に較正された予測を提供し、予測指標の点で競争力のある性能を達成しながら、有益な分類群を抽出する手法の有用性を実証している。注目すべきは、プールされたデータセットの異質性(例えば、異なる実験目的、実験室のセットアップ、シーケンス機器、患者の人口統計学)にもかかわらず、我々の手法は頑健な結果をもたらしたことである。

要約(オリジナル)

This paper proposes a hierarchical Bayesian multitask learning model that is applicable to the general multi-task binary classification learning problem where the model assumes a shared sparsity structure across different tasks. We derive a computationally efficient inference algorithm based on variational inference to approximate the posterior distribution. We demonstrate the potential of the new approach on various synthetic datasets and for predicting human health status based on microbiome profile. Our analysis incorporates data pooled from multiple microbiome studies, along with a comprehensive comparison with other benchmark methods. Results in synthetic datasets show that the proposed approach has superior support recovery property when the underlying regression coefficients share a common sparsity structure across different tasks. Our experiments on microbiome classification demonstrate the utility of the method in extracting informative taxa while providing well-calibrated predictions with uncertainty quantification and achieving competitive performance in terms of prediction metrics. Notably, despite the heterogeneity of the pooled datasets (e.g., different experimental objectives, laboratory setups, sequencing equipment, patient demographics), our method delivers robust results.

arxiv情報

著者 Haonan Zhu,Andre R. Goncalves,Camilo Valdes,Hiranmayi Ranganathan,Boya Zhang,Jose Manuel Martí,Car Reen Kok,Monica K. Borucki,Nisha J. Mulakken,James B. Thissen,Crystal Jaing,Alfred Hero,Nicholas A. Be
発行日 2025-02-04 18:23:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, q-bio.BM, stat.AP, stat.CO, stat.ME パーマリンク