要約
タイトル: 異種知識グラフにおけるGNNに基づくエンティティアラインメントの再考:新しいデータセットと新しい方法
要約:
– 知識グラフ(KG)アプリケーションの開発は、様々なソースから抽出された異種KG間のエンティティアラインメント(EA)に対する需要の増大をもたらしました。
– 近年、グラフニューラルネットワーク(GNN)は、構造情報をキャプチャする能力の高さから、EAタスクで広く採用されています。
– しかしながら、既存の共通EAデータセットの過度に単純化された設定は、現実世界のシナリオからは遠く、最近の方法の進歩を完全に理解することを阻止しています。
– 本研究では、現実的な設定でEA方法のパフォーマンスを調べるために、規模や構造が異なり、オーバーラップするエンティティ数が少ない、高度に異種なKG(HHKG)のアラインメントに焦点を当てます。
– まず、不合理な設定を掃除し、実世界のEAシナリオに密接に似た2つの新しいHHKGデータセットを提案します。
– 次に、提案されたデータセットに基づいて、前代表的なEA方法を評価するために広範な実験を行い、GNNに基づくEA方法の進歩について興味深い発見を明らかにします。
– 構造情報は探索が困難になりましたが、HHKGのアラインメントにおいてはまだ有益であることがわかります。この現象は、既存のEA方法、特にGNNに基づく方法の性能低下につながります。
– 著者らは、GNNに基づく方法を全てのEAデータセットのパナシアとして反応することによって引き起こされる可能性のある問題に光を当て、最後に、エンティティ名、構造、時間情報を包括的に利用するシンプルながら効果的な方法Simple-HHEAを導入します。
– 実験結果は、Simple-HHEAがHHKGデータセットで前のモデルよりも優れたパフォーマンスを発揮することを示しています。
要約(オリジナル)
The development of knowledge graph (KG) applications has led to a rising need for entity alignment (EA) between heterogeneous KGs that are extracted from various sources. Recently, graph neural networks (GNNs) have been widely adopted in EA tasks due to GNNs’ impressive ability to capture structure information. However, we have observed that the oversimplified settings of the existing common EA datasets are distant from real-world scenarios, which obstructs a full understanding of the advancements achieved by recent methods. This phenomenon makes us ponder: Do existing GNN-based EA methods really make great progress? In this paper, to study the performance of EA methods in realistic settings, we focus on the alignment of highly heterogeneous KGs (HHKGs) (e.g., event KGs and general KGs) which are different with regard to the scale and structure, and share fewer overlapping entities. First, we sweep the unreasonable settings, and propose two new HHKG datasets that closely mimic real-world EA scenarios. Then, based on the proposed datasets, we conduct extensive experiments to evaluate previous representative EA methods, and reveal interesting findings about the progress of GNN-based EA methods. We find that the structural information becomes difficult to exploit but still valuable in aligning HHKGs. This phenomenon leads to inferior performance of existing EA methods, especially GNN-based methods. Our findings shed light on the potential problems resulting from an impulsive application of GNN-based methods as a panacea for all EA datasets. Finally, we introduce a simple but effective method: Simple-HHEA, which comprehensively utilizes entity name, structure, and temporal information. Experiment results show Simple-HHEA outperforms previous models on HHKG datasets.
arxiv情報
| 著者 | Xuhui Jiang,Chengjin Xu,Yinghan Shen,Fenglong Su,Yuanzhuo Wang,Fei Sun,Zixuan Li,Huawei Shen | 
| 発行日 | 2023-04-10 13:17:25+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, OpenAI
