Learning Staged Trees from Incomplete Data

要約

ステージング ツリーは、頂点の色付けによって非対称の独立性の任意のクラスを表現できる確率的グラフィック モデルです。
頻度主義またはベイズ主義のパラダイムの下で、データから段階的なツリーを学習するために、いくつかの構造学習ルーチンが定義および実装されています。
彼らは、データセットが完全に観察されたことを前提としており、実際には、欠落しているエントリのある観察は、モデルを学習する前に削除されるか補完されます。
ここでは、モデルの学習内で欠損を処理するステージング ツリーの最初のアルゴリズムを紹介します。
この目的を達成するために、欠損データが存在する場合の段階的ツリー モデルの尤度を特徴付け、それを近似する擬似尤度について説明します。
完全尤度からモデルを直接推定する構造的期待値最大化アルゴリズムも実装され、評価されます。
計算実験では、新しい学習アルゴリズムのパフォーマンスを示し、段階的なツリーを学習するときにさまざまな欠損パターンを考慮できることが実証されました。

要約(オリジナル)

Staged trees are probabilistic graphical models capable of representing any class of non-symmetric independence via a coloring of its vertices. Several structural learning routines have been defined and implemented to learn staged trees from data, under the frequentist or Bayesian paradigm. They assume a data set has been observed fully and, in practice, observations with missing entries are either dropped or imputed before learning the model. Here, we introduce the first algorithms for staged trees that handle missingness within the learning of the model. To this end, we characterize the likelihood of staged tree models in the presence of missing data and discuss pseudo-likelihoods that approximate it. A structural expectation-maximization algorithm estimating the model directly from the full likelihood is also implemented and evaluated. A computational experiment showcases the performance of the novel learning algorithms, demonstrating that it is feasible to account for different missingness patterns when learning staged trees.

arxiv情報

著者 Jack Storror Carter,Manuele Leonelli,Eva Riccomagno,Gherardo Varando
発行日 2024-05-28 16:00:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク