Gradient Flow of Energy: A General and Efficient Approach for Entity Alignment Decoding

要約

エンティティ アライメント (EA) は、マルチソース ナレッジ グラフ (KG) を統合する際の極めて重要なプロセスであり、これらのグラフ全体で同等のエンティティ ペアを特定しようとします。
既存のアプローチのほとんどは、EA をグラフ表現学習タスクとみなして、グラフ エンコーダの強化に重点を置いています。
ただし、効果的な操作と位置合わせの精度に不可欠な EA のデコード プロセスは注目が限定的であり、依然として特定のデータセットとモデル アーキテクチャに合わせて調整されているため、エンティティと追加の明示的な関係の埋め込みの両方が必要です。
この特異性により、特に GNN ベースのモデルでの適用性が制限されます。
このギャップに対処するために、エンティティの埋め込みのみに依存する、EA のための新しく一般化された効率的なデコード アプローチを導入します。
私たちの方法は、ディリクレ エネルギーを最小限に抑えることで復号化プロセスを最適化し、グラフ内の勾配の流れをもたらし、グラフの相同性を最大化します。
勾配フローの離散化により、トリプル特徴伝播 (TFP) と呼ばれる、高速でスケーラブルなアプローチが生成されます。
TFP は、隣接行列をマルチビュー行列 (エンティティ対エンティティ、エンティティ対リレーション、リレーション対エンティティ、リレーション対トリプル) に革新的に一般化します。
一般化行列を介した勾配フローにより、TFP は KG のマルチビュー構造情報を活用できます。
多様な公開データセットに対する厳密な実験により、私たちのアプローチがさまざまな EA 手法を大幅に強化することが実証されました。
特に、このアプローチは 6 秒未満の追加の計算時間でこれらの進歩を達成し、将来の EA 手法の効率と適応性における新しいベンチマークを確立します。

要約(オリジナル)

Entity alignment (EA), a pivotal process in integrating multi-source Knowledge Graphs (KGs), seeks to identify equivalent entity pairs across these graphs. Most existing approaches regard EA as a graph representation learning task, concentrating on enhancing graph encoders. However, the decoding process in EA – essential for effective operation and alignment accuracy – has received limited attention and remains tailored to specific datasets and model architectures, necessitating both entity and additional explicit relation embeddings. This specificity limits its applicability, particularly in GNN-based models. To address this gap, we introduce a novel, generalized, and efficient decoding approach for EA, relying solely on entity embeddings. Our method optimizes the decoding process by minimizing Dirichlet energy, leading to the gradient flow within the graph, to maximize graph homophily. The discretization of the gradient flow produces a fast and scalable approach, termed Triple Feature Propagation (TFP). TFP innovatively generalizes adjacency matrices to multi-views matrices:entity-to-entity, entity-to-relation, relation-to-entity, and relation-to-triple. The gradient flow through generalized matrices enables TFP to harness the multi-view structural information of KGs. Rigorous experimentation on diverse public datasets demonstrates that our approach significantly enhances various EA methods. Notably, the approach achieves these advancements with less than 6 seconds of additional computational time, establishing a new benchmark in efficiency and adaptability for future EA methods.

arxiv情報

著者 Yuanyi Wang,Haifeng Sun,Jingyu Wang,Qi Qi,Shaoling Sun,Jianxin Liao
発行日 2024-04-17 17:00:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク