Structural perspective on constraint-based learning of Markov networks

要約

マルコフ ネットワークは、変数間の条件付き独立関係を表す無向グラフを使用する確率的グラフィカル モデルです。
私たちは制約ベースの構造学習に焦点を当てています。これには、条件付き独立性テストの実行を通じてデータから無向グラフを学習することが含まれます。
マルコフ ネットワークの制約ベースの学習の 2 つの重要な側面、つまりテストの数と条件付けセットのサイズに関する理論的制限を確立します。
これらの境界は、グラフの構造特性とマルコフ ネットワークの学習に必要なテスト量との間の刺激的な相互作用を明らかにします。
私たちの研究の出発点は、グラフ パラメーターの最大ペア接続性 $\kappa$、つまりグラフ内の頂点のペアを接続する頂点に共通でないパスの最大数が、必要な独立性テストのサイズに関与するということです。
グラフを学びます。
一方で、少なくとも $\kappa$ の条件セットのサイズを持つ少なくとも 1 つのテストが常に必要であることを示します。
一方、最大 $\kappa$ のサイズのテストを実行することで、任意のグラフを学習できることを証明します。
これにより、グラフを学習するために必要な条件セットの最小サイズの問題が完全に解決されます。
テストの数に関して言えば、条件セットのサイズの上限は、すべての $n$-頂点グラフは、最大 $n^{\kappa}$ サイズの条件セットを使用した最大 $n^{\kappa}$ テストで学習できることを意味します。
\カッパ$。
条件セットのサイズの上限 $q$ について、学習するために少なくとも $n^{\Omega(\kappa)}$ テストを必要とする $O(n q)$ 頂点を持つグラフが存在することを示します。
この下限は、ツリー幅とグラフの最大次数が最大 $\kappa+2$ の場合でも当てはまります。
良い点として、有界ツリー幅のすべてのグラフは、最大 $2\kappa$ のサイズの条件セットを使用した多項式のテストによって学習できることが証明されます。

要約(オリジナル)

Markov networks are probabilistic graphical models that employ undirected graphs to depict conditional independence relationships among variables. Our focus lies in constraint-based structure learning, which entails learning the undirected graph from data through the execution of conditional independence tests. We establish theoretical limits concerning two critical aspects of constraint-based learning of Markov networks: the number of tests and the sizes of the conditioning sets. These bounds uncover an exciting interplay between the structural properties of the graph and the amount of tests required to learn a Markov network. The starting point of our work is that the graph parameter maximum pairwise connectivity, $\kappa$, that is, the maximum number of vertex-disjoint paths connecting a pair of vertices in the graph, is responsible for the sizes of independence tests required to learn the graph. On one hand, we show that at least one test with the size of the conditioning set at least $\kappa$ is always necessary. On the other hand, we prove that any graph can be learned by performing tests of size at most $\kappa$. This completely resolves the question of the minimum size of conditioning sets required to learn the graph. When it comes to the number of tests, our upper bound on the sizes of conditioning sets implies that every $n$-vertex graph can be learned by at most $n^{\kappa}$ tests with conditioning sets of sizes at most $\kappa$. We show that for any upper bound $q$ on the sizes of the conditioning sets, there exist graphs with $O(n q)$ vertices that require at least $n^{\Omega(\kappa)}$ tests to learn. This lower bound holds even when the treewidth and the maximum degree of the graph are at most $\kappa+2$. On the positive side, we prove that every graph of bounded treewidth can be learned by a polynomial number of tests with conditioning sets of sizes at most $2\kappa$.

arxiv情報

著者 Tuukka Korhonen,Fedor V. Fomin,Pekka Parviainen
発行日 2024-03-13 14:14:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DM, cs.LG パーマリンク