Probabilities of the Third Type: Statistical Relational Learning and Reasoning with Relative Frequencies

要約

リレーショナル データに対する確率的な依存関係をモデル化する場合、ドメイン内の状態の相対頻度に対する依存関係が一般的です。
たとえば、流行中に学校が閉鎖される可能性は、感染した生徒の割合がしきい値を超えるかどうかに依存する可能性があります。
多くの場合、依存関係は個別のしきい値に依存するのではなく、連続的です。たとえば、1 つの蚊に刺されて病気が伝染する可能性は、保菌蚊の割合に依存します。
現在のアプローチは通常、ドメイン要素自体ではなく、可能な世界の確率のみを考慮します。
例外は、条件付き確率ロジック用に最近導入されたリフト ベイジアン ネットワークであり、確率データに対する離散的な依存関係を表現します。
相対周波数への連続依存関係を統計的リレーショナル人工知能に明示的に組み込む形式主義である関数型リフト ベイジアン ネットワークを導入し、条件付き確率ロジックのリフト ベイジアン ネットワークと比較対照します。
相対周波数を組み込むことは、モデリングに有益なだけではありません。
また、トレーニングとテスト、またはアプリケーションのドメインのサイズが異なる場合の学習問題に対する、より厳密なアプローチも提供します。
この目的を達成するために、サイズが増加するドメイン上の関数的リフト ベイジアン ネットワークによって誘発される漸近確率分布の表現を提供します。
この表現はドメイン サイズ全体にわたるスケーリング動作がよく理解されているため、ランダムにサンプリングされた部分母集団から大きなドメインのパラメーターを一貫して推定するために使用できます。
さらに、FLBN のパラメトリック ファミリでは、収束がパラメーター内で均一であり、これにより漸近確率がモデルのパラメーターに有意に依存することが保証されることを示します。

要約(オリジナル)

Dependencies on the relative frequency of a state in the domain are common when modelling probabilistic dependencies on relational data. For instance, the likelihood of a school closure during an epidemic might depend on the proportion of infected pupils exceeding a threshold. Often, rather than depending on discrete thresholds, dependencies are continuous: for instance, the likelihood of any one mosquito bite transmitting an illness depends on the proportion of carrier mosquitoes. Current approaches usually only consider probabilities over possible worlds rather than over domain elements themselves. An exception are the recently introduced lifted Bayesian networks for conditional probability logic, which express discrete dependencies on probabilistic data. We introduce functional lifted Bayesian networks, a formalism that explicitly incorporates continuous dependencies on relative frequencies into statistical relational artificial intelligence, and compare and contrast them with lifted Bayesian networks for conditional probability logic. Incorporating relative frequencies is not only beneficial to modelling; it also provides a more rigorous approach to learning problems where training and test or application domains have different sizes. To this end, we provide a representation of the asymptotic probability distributions induced by functional lifted Bayesian networks on domains of increasing sizes. Since that representation has well-understood scaling behaviour across domain sizes, it can be used to estimate parameters for a large domain consistently from randomly sampled subpopulations. Furthermore, we show that in parametric families of FLBN, convergence is uniform in the parameters, which ensures a meaningful dependence of the asymptotic probabilities on the parameters of the model.

arxiv情報

著者 Felix Weitkämper
発行日 2024-08-20 12:50:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.LO, I.2.4 パーマリンク