要約
Web リソースの意味的な関連性を評価することは、依然として未解決の課題です。
この論文は、コーパスベースのアプローチの代替となる知識ベースの方法に焦点を当てており、一般にナレッジ グラフの可用性に依存します。
特に、既存の文献から 10 の方法を選択し、隣接リソース、トリプル パターン、およびトリプル重みベースの方法に従って整理しました。
これらは、DBpedia を参照 RDF ナレッジ グラフとして使用して実装および評価されています。
DBpedia は継続的に進化しているため、文献にあるこれらの方法によって提供される実験結果は比較できません。
このため、この作業では、そのような方法を同じ DBpedia リリース上で 14 のよく知られたゴールデン データセットに対してすべて一度に実行することで実験しました。
実験結果に従って得られた人間の判断との相関値に基づいて、比較されたリソースをリンクするすべての有向パスの評価と組み合わせて RDF トリプルの重み付けを行うことは、DBpedia で意味的関連性を計算するための最良の戦略です。
要約(オリジナル)
Evaluating semantic relatedness of Web resources is still an open challenge. This paper focuses on knowledge-based methods, which represent an alternative to corpus-based approaches, and rely in general on the availability of knowledge graphs. In particular, we have selected 10 methods from the existing literature, that have been organized according to it adjacent resources, triple patterns, and triple weights-based methods. They have been implemented and evaluated by using DBpedia as reference RDF knowledge graph. Since DBpedia is continuously evolving, the experimental results provided by these methods in the literature are not comparable. For this reason, in this work, such methods have been experimented by running them all at once on the same DBpedia release and against 14 well-known golden datasets. On the basis of the correlation values with human judgment obtained according to the experimental results, weighting the RDF triples in combination with evaluating all the directed paths linking the compared resources is the best strategy in order to compute semantic relatedness in DBpedia.
arxiv情報
著者 | Anna Formica,Francesco Taglino |
発行日 | 2023-08-18 12:26:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google