Subgraph2vec: A random walk-based algorithm for embedding knowledge graphs

要約

グラフは重要なデータ表現であり、実世界のアプリケーションで自然に使用される。そのため、グラフを分析することで、異常検知、意思決定、クラスタリング、分類など、様々な分野でより良い洞察を得ることができます。しかし、これらの方法のほとんどは、高レベルの計算時間と空間を必要とする。これらのコストを削減するために、埋め込みなどの他の方法を用いることができる。知識グラフ(KG)埋め込みは、KGのベクトル表現を実現することを目的とした手法である。KGのエンティティや関係を、それらの意味的な意味を維持したまま低次元空間に表現する。グラフの埋め込みには、node2vec、metapath2vec、regpattern2vecといったランダムウォークに基づく手法など、様々な手法がある。しかし、これらの手法のほとんどは、通常アルゴリズムにハードコードされた硬直したパターンに基づいてウォークを偏らせる。本研究では、ユーザが定義した部分グラフの内部でウォークを実行するKGを埋め込むために、୧⃛(๑⃙⃘⁼̴̀꒳⁼̴́๑⃙⃘)୨⃛を導入する。この埋め込みをリンク予測に利用し、我々の手法が従来の手法と比較して、ほとんどのケースで優れた性能を持つことを証明する。

要約(オリジナル)

Graph is an important data representation which occurs naturally in the real world applications \cite{goyal2018graph}. Therefore, analyzing graphs provides users with better insights in different areas such as anomaly detection \cite{ma2021comprehensive}, decision making \cite{fan2023graph}, clustering \cite{tsitsulin2023graph}, classification \cite{wang2021mixup} and etc. However, most of these methods require high levels of computational time and space. We can use other ways like embedding to reduce these costs. Knowledge graph (KG) embedding is a technique that aims to achieve the vector representation of a KG. It represents entities and relations of a KG in a low-dimensional space while maintaining the semantic meanings of them. There are different methods for embedding graphs including random walk-based methods such as node2vec, metapath2vec and regpattern2vec. However, most of these methods bias the walks based on a rigid pattern usually hard-coded in the algorithm. In this work, we introduce \textit{subgraph2vec} for embedding KGs where walks are run inside a user-defined subgraph. We use this embedding for link prediction and prove our method has better performance in most cases in comparison with the previous ones.

arxiv情報

著者 Elika Bozorgi,Saber Soleimani,Sakher Khalil Alqaiidi,Hamid Reza Arabnia,Krzysztof Kochut
発行日 2024-05-03 16:51:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG パーマリンク