要約
エンティティ アライメント (EA) は、マルチソース ナレッジ グラフ (KG) を統合する際の極めて重要なプロセスであり、これらのグラフ全体で同等のエンティティ ペアを特定しようとします。
既存のアプローチのほとんどは、EA をグラフ表現学習タスクとみなして、グラフ エンコーダの強化に重点を置いています。
ただし、効果的な操作と位置合わせの精度に不可欠な EA のデコード プロセスは注目が限定的であり、依然として特定のデータセットとモデル アーキテクチャに合わせて調整されているため、エンティティと追加の明示的な関係の埋め込みの両方が必要です。
この特異性により、特に GNN ベースのモデルでの適用性が制限されます。
このギャップに対処するために、エンティティの埋め込みのみに依存する、EA のための新しく一般化された効率的なデコード アプローチを導入します。
私たちの方法は、ディリクレ エネルギーを最小限に抑えることで復号化プロセスを最適化し、グラフ内の勾配の流れをもたらし、グラフの相同性を促進します。
勾配フローの離散化により、トリプル特徴伝播 (TFP) と呼ばれる、高速でスケーラブルなアプローチが生成されます。
TFP は、エンティティからエンティティ、エンティティからリレーション、およびリレーションからエンティティという 3 つのビューを通じて勾配フローを革新的に導きます。
この一般化された勾配フローにより、TFP は KG のマルチビュー構造情報を活用できます。
現実世界の多様なデータセットに対する厳密な実験により、私たちのアプローチがさまざまな EA 手法を大幅に強化することが実証されました。
特に、このアプローチは 6 秒未満の追加の計算時間でこれらの進歩を達成し、将来の EA 手法の効率と適応性における新しいベンチマークを確立します。
要約(オリジナル)
Entity alignment (EA), a pivotal process in integrating multi-source Knowledge Graphs (KGs), seeks to identify equivalent entity pairs across these graphs. Most existing approaches regard EA as a graph representation learning task, concentrating on enhancing graph encoders. However, the decoding process in EA – essential for effective operation and alignment accuracy – has received limited attention and remains tailored to specific datasets and model architectures, necessitating both entity and additional explicit relation embeddings. This specificity limits its applicability, particularly in GNN-based models. To address this gap, we introduce a novel, generalized, and efficient decoding approach for EA, relying solely on entity embeddings. Our method optimizes the decoding process by minimizing Dirichlet energy, leading to the gradient flow within the graph, to promote graph homophily. The discretization of the gradient flow produces a fast and scalable approach, termed Triple Feature Propagation (TFP). TFP innovatively channels gradient flow through three views: entity-to-entity, entity-to-relation, and relation-to-entity. This generalized gradient flow enables TFP to harness the multi-view structural information of KGs. Rigorous experimentation on diverse real-world datasets demonstrates that our approach significantly enhances various EA methods. Notably, the approach achieves these advancements with less than 6 seconds of additional computational time, establishing a new benchmark in efficiency and adaptability for future EA methods.
arxiv情報
著者 | Yuanyi Wang,Haifeng Sun,Jingyu Wang,Qi Qi,Shaoling Sun,Jianxin Liao |
発行日 | 2024-01-23 14:31:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google