Multinomial belief networks

要約

機械学習へのベイジアン アプローチは、不確実性を定量化したり、欠落した観測値に対処したりする必要がある場合、サンプルが不足している場合、またはデータがまばらな場合に魅力的です。
これらはすべて、医療データを分析するときに一般的に当てはまります。
これらの分析要件に対処するために、ネットワークの重みと隠れ単位の両方がディリクレ分布される多項カウント データの深い生成モデルを提案します。
Gibbs サンプリング手順は、Zhou-Cong-Chen モデルに類似した一連の拡張関係を利用して定式化されます。
私たちはこのモデルを小さな手書きの数字と、がんにおける DNA 変異の大規模な実験データセットに適用し、このモデルが完全にデータ駆動型の方法で生物学的に意味のあるメタシグネチャをどのように抽出できるかを示します。

要約(オリジナル)

A Bayesian approach to machine learning is attractive when we need to quantify uncertainty, deal with missing observations, when samples are scarce, or when the data is sparse. All of these commonly apply when analysing healthcare data. To address these analytical requirements, we propose a deep generative model for multinomial count data where both the weights and hidden units of the network are Dirichlet distributed. A Gibbs sampling procedure is formulated that takes advantage of a series of augmentation relations, analogous to the Zhou-Cong-Chen model. We apply the model on small handwritten digits, and a large experimental dataset of DNA mutations in cancer, and we show how the model is able to extract biologically meaningful meta-signatures in a fully data-driven way.

arxiv情報

著者 H. C. Donker,D. Neijzen,G. A. Lunter
発行日 2023-11-28 16:12:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.AP, stat.ML パーマリンク