要約
タイトル: danglingケースにおけるエンティティアラインメントのグラフ構造情報の調査
要約:
– エンティティアラインメント(Entity alignment)は、異なる知識グラフ(KG)内で同等のエンティティを発見することを目的としており、知識エンジニアリングにおいて重要な役割を果たしています。
– 最近では、対応する同等のエンティティが存在しない未知のエンティティ(Dangling entities)を含むより現実的な問題設定であるDangling casesのエンティティアラインメントが提案されています。
– これまで、翻訳API、事前学習済みの単語埋め込み、その他の既製品のツールを利用してこの問題を解決する研究がいくつか行われてきました。しかし、これらのアプローチは側面情報(エンティティ名など)に過剰に依存しており、側面情報が欠落した場合には機能しない場合があります。
– 本論文では、KGの最も基本的なグラフ構造情報を十分に活用していないことが指摘されています。
– そこで、グラフ構造情報の活用を改善するために、Weakly-Optimal Graph Contrastive Learning(WOGCL)と呼ばれる新しいエンティティアラインメントフレームワークを提案しています。
– WOGCLでは、次の3つの次元で改善を行なっています: (i) モデル。グラフ構造の局所的およびグローバルな類似性を捉えるために、新しいGated Graph Attention Networkを提案しています。(ii)学習。対比学習と最適輸送学習の2つの学習目的を設定し、最適輸送計画を介して区別可能なエンティティ表現を獲得します。(iii) 推論。PageRankベースの方法を提案し、高階構造的類似性を計算します。
– 2つのdanglingベンチマークでの幅広い実験により、WOGCLが従来の(緩和)およびdangling(合併)設定の両方で、純粋な構造情報で最先端の方法を上回ることが示されました。コードは近日中に公開されます。
要約(オリジナル)
Entity alignment (EA) aims to discover the equivalent entities in different knowledge graphs (KGs), which play an important role in knowledge engineering. Recently, EA with dangling entities has been proposed as a more realistic setting, which assumes that not all entities have corresponding equivalent entities. In this paper, we focus on this setting. Some work has explored this problem by leveraging translation API, pre-trained word embeddings, and other off-the-shelf tools. However, these approaches over-rely on the side information (e.g., entity names), and fail to work when the side information is absent. On the contrary, they still insufficiently exploit the most fundamental graph structure information in KG. To improve the exploitation of the structural information, we propose a novel entity alignment framework called Weakly-Optimal Graph Contrastive Learning (WOGCL), which is refined on three dimensions : (i) Model. We propose a novel Gated Graph Attention Network to capture local and global graph structure similarity. (ii) Training. Two learning objectives: contrastive learning and optimal transport learning are designed to obtain distinguishable entity representations via the optimal transport plan. (iii) Inference. In the inference phase, a PageRank-based method is proposed to calculate higher-order structural similarity. Extensive experiments on two dangling benchmarks demonstrate that our WOGCL outperforms the current state-of-the-art methods with pure structural information in both traditional (relaxed) and dangling (consolidated) settings. The code will be public soon.
arxiv情報
著者 | Jin Xu,Yangning Li,Xiangjin Xie,Yinghui Li,Niu Hu,Haitao Zheng,Yong Jiang |
発行日 | 2023-04-10 17:24:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI