Truveta Mapper: A Zero-shot Ontology Alignment Framework

要約

この論文では、教師なしオントロジー マッチング (OM) またはオントロジー アライメント (OA) を翻訳タスクとして扱うことにより、新しい視点を提案します。
オントロジーはグラフとして表され、変換はソース オントロジー グラフのノードからターゲット オントロジー グラフのパスまで実行されます。
提案されたフレームワークである Truveta Mapper (TM) は、マルチタスクのシーケンス間トランスフォーマー モデルを利用して、ゼロショット、統合されたエンドツーエンドの方法で複数のオントロジーにわたる調整を実行します。
マルチタスクにより、モデルは明示的にクロスオントロジーに手動でラベル付けされたデータを必要とせずに、転移学習を介して異なるオントロジー間の関係を暗黙的に学習できます。
これにより、策定されたフレームワークは、実行時のレイテンシとアライメント品質の両方において既存のソリューションよりも優れたパフォーマンスを発揮できるようになります。
このモデルは、公開されているテキスト コーパスと内部オントロジー データにのみ基づいて事前トレーニングされ、微調整されています。
提案されたソリューションは、最先端のアプローチ、編集類似性、LogMap、AML、BERTMap、およびオントロジー アラインメント評価イニシアチブ (OAEI22) で最近発表された新しい OM フレームワークを上回り、対数線形の複雑さを提供し、全体的に OM を実現します。
マッピングの拡張やマッピングの修復などの後処理をあまり必要とせずに、タスクを効率的かつ簡単に実行できます。
私たちはソリューションをオープンソース化しています。

要約(オリジナル)

In this paper, a new perspective is suggested for unsupervised Ontology Matching (OM) or Ontology Alignment (OA) by treating it as a translation task. Ontologies are represented as graphs, and the translation is performed from a node in the source ontology graph to a path in the target ontology graph. The proposed framework, Truveta Mapper (TM), leverages a multi-task sequence-to-sequence transformer model to perform alignment across multiple ontologies in a zero-shot, unified and end-to-end manner. Multi-tasking enables the model to implicitly learn the relationship between different ontologies via transfer-learning without requiring any explicit cross-ontology manually labeled data. This also enables the formulated framework to outperform existing solutions for both runtime latency and alignment quality. The model is pre-trained and fine-tuned only on publicly available text corpus and inner-ontologies data. The proposed solution outperforms state-of-the-art approaches, Edit-Similarity, LogMap, AML, BERTMap, and the recently presented new OM frameworks in Ontology Alignment Evaluation Initiative (OAEI22), offers log-linear complexity, and overall makes the OM task efficient and more straightforward without much post-processing involving mapping extension or mapping repair. We are open sourcing our solution.

arxiv情報

著者 Mariyam Amir,Murchana Baruah,Mahsa Eslamialishah,Sina Ehsani,Alireza Bahramali,Sadra Naddaf-Sh,Saman Zarandioon
発行日 2023-08-22 00:22:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク