要約
知識グラフ補完のためのルール学習アプローチは、効率的で解釈可能であり、純粋なニューラル・モデルと競合する。ルール集約問題は、複数のルールによって同時に予測された候補事実に対して、1つの確からしさスコアを見つけることに関係する。この問題は、データ駆動型のルール学習により、ノイズの多い大規模なルールセットが生成される可能性があるため、どこにでも存在する問題であるが、文献的にはあまり扱われておらず、その理論的基礎もこの文脈ではこれまで研究されてこなかった。本研究では、既存の集約アプローチが、予測ルールに対する限界推論操作として表現できることを示す。特に、最も信頼度の高いルールに基づいて候補をスコアリングする、一般的なマックス集約戦略が、確率論的解釈を持つことを示す。最後に、これまでの戦略を組み合わせた、効率的で見過ごされがちなベースラインを提案し、計算コストの高いアプローチに対して競争力を持つ。
要約(オリジナル)
Rule learning approaches for knowledge graph completion are efficient, interpretable and competitive to purely neural models. The rule aggregation problem is concerned with finding one plausibility score for a candidate fact which was simultaneously predicted by multiple rules. Although the problem is ubiquitous, as data-driven rule learning can result in noisy and large rulesets, it is underrepresented in the literature and its theoretical foundations have not been studied before in this context. In this work, we demonstrate that existing aggregation approaches can be expressed as marginal inference operations over the predicting rules. In particular, we show that the common Max-aggregation strategy, which scores candidates based on the rule with the highest confidence, has a probabilistic interpretation. Finally, we propose an efficient and overlooked baseline which combines the previous strategies and is competitive to computationally more expensive approaches.
arxiv情報
著者 | Patrick Betz,Stefan Lüdtke,Christian Meilicke,Heiner Stuckenschmidt |
発行日 | 2023-09-01 07:32:11+00:00 |
arxivサイト | arxiv_id(pdf) |