Unsupervised Deep Cross-Language Entity Alignment

要約

言語間のエンティティの調整は、異なる言語のナレッジ グラフから同じ意味エンティティを見つけるタスクです。
この論文では、言語間のエンティティの位置合わせのためのシンプルで新しい教師なし手法を提案します。
深層学習多言語エンコーダーと機械翻訳機能を組み合わせてナレッジ グラフ テキストをエンコードし、ラベル データへの依存を軽減します。
グローバルまたはローカルのアライメントのみを強調する従来の方法とは異なり、私たちの方法では両方のアライメント戦略を同時に考慮します。
まず位置合わせタスクを 2 部構成のマッチング問題として捉え、次に位置合わせを達成するために再交換のアイデアを採用します。
1 つの最適解のみを与える従来の 2 部マッチング アルゴリズムと比較して、当社のアルゴリズムはランク付けされたマッチング結果を生成し、多くの潜在的な下流タスクを可能にします。
さらに、私たちの方法では、2 部マッチング プロセスで 2 つの異なるタイプの最適化 (最小と最大) を適用できるため、柔軟性が向上します。
私たちの評価によると、中国語、日本語、およびフランス語から英語への対応付けタスクにおいて、DBP15K データセットでそれぞれ 0.966、0.990、および 0.996 の Hits@1 率を獲得しました。
私たちは、教師なしおよび半教師ありのカテゴリーで最先端の手法を上回りました。
最先端の教師あり手法と比較して、私たちの手法は、Ja-En および Fr-En アライメント タスクでは 2.6% および 0.4% 優れていますが、Zh-En アライメント タスクではわずかに 0.2% 劣っています。

要約(オリジナル)

Cross-lingual entity alignment is the task of finding the same semantic entities from different language knowledge graphs. In this paper, we propose a simple and novel unsupervised method for cross-language entity alignment. We utilize the deep learning multi-language encoder combined with a machine translator to encode knowledge graph text, which reduces the reliance on label data. Unlike traditional methods that only emphasize global or local alignment, our method simultaneously considers both alignment strategies. We first view the alignment task as a bipartite matching problem and then adopt the re-exchanging idea to accomplish alignment. Compared with the traditional bipartite matching algorithm that only gives one optimal solution, our algorithm generates ranked matching results which enabled many potentials downstream tasks. Additionally, our method can adapt two different types of optimization (minimal and maximal) in the bipartite matching process, which provides more flexibility. Our evaluation shows, we each scored 0.966, 0.990, and 0.996 Hits@1 rates on the DBP15K dataset in Chinese, Japanese, and French to English alignment tasks. We outperformed the state-of-the-art method in unsupervised and semi-supervised categories. Compared with the state-of-the-art supervised method, our method outperforms 2.6% and 0.4% in Ja-En and Fr-En alignment tasks while marginally lower by 0.2% in the Zh-En alignment task.

arxiv情報

著者 Chuanyu Jiang,Yiming Qian,Lijun Chen,Yang Gu,Xia Xie
発行日 2023-09-19 13:12:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク