Negative Sampling in Knowledge Graph Representation Learning: A Review

要約

ナレッジ グラフ表現学習 (KGRL) またはナレッジ グラフ埋め込み (KGE) は、知識構築と情報探索のための AI アプリケーションで重要な役割を果たします。
これらのモデルは、ナレッジ グラフに存在するエンティティと関係を低次元のベクトル空間にエンコードすることを目的としています。
KGE モデルのトレーニング プロセスでは、識別目的で陽性サンプルと陰性サンプルを使用することが不可欠になります。
ただし、既存のナレッジ グラフから直接ネガティブ サンプルを取得することには課題があり、効果的な生成手法の必要性が強調されています。
これらのネガティブ サンプルの品質は、学習された埋め込みの精度に大きな影響を与えるため、その生成は KGRL の重要な側面となります。
この包括的な調査論文では、さまざまなネガティブ サンプリング (NS) 手法と、KGRL の成功に対するその手法の貢献を系統的にレビューしています。
既存の NS 手法を 5 つの異なるカテゴリに分類することで、それぞれの長所と短所を概説します。
さらに、この調査では、将来の調査の潜在的な方向性として役立つ未解決の研究課題が特定されます。
この調査は、基本的な NS 概念の一般化と調整を提供することにより、KGRL のコンテキストで効果的な NS 手法を設計するための貴重な洞察を提供し、この分野のさらなる進歩への原動力として機能します。

要約(オリジナル)

Knowledge graph representation learning (KGRL) or knowledge graph embedding (KGE) plays a crucial role in AI applications for knowledge construction and information exploration. These models aim to encode entities and relations present in a knowledge graph into a lower-dimensional vector space. During the training process of KGE models, using positive and negative samples becomes essential for discrimination purposes. However, obtaining negative samples directly from existing knowledge graphs poses a challenge, emphasizing the need for effective generation techniques. The quality of these negative samples greatly impacts the accuracy of the learned embeddings, making their generation a critical aspect of KGRL. This comprehensive survey paper systematically reviews various negative sampling (NS) methods and their contributions to the success of KGRL. Their respective advantages and disadvantages are outlined by categorizing existing NS methods into five distinct categories. Moreover, this survey identifies open research questions that serve as potential directions for future investigations. By offering a generalization and alignment of fundamental NS concepts, this survey provides valuable insights for designing effective NS methods in the context of KGRL and serves as a motivating force for further advancements in the field.

arxiv情報

著者 Tiroshan Madushanka,Ryutaro Ichise
発行日 2024-02-29 14:26:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク