AutoRDF2GML: Facilitating RDF Integration in Graph Machine Learning


このペーパーでは、RDF データをグラフ機械学習タスクに合わせたデータ表現に変換するように設計されたフレームワークである AutoRDF2GML を紹介します。
AutoRDF2GML により、コンテンツ ベースの機能 (RDF データ型プロパティに基づく機能) とトポロジ ベースの機能 (RDF オブジェクト プロパティに基づく機能) の両方の作成が初めて可能になります。
自動化された特徴抽出を特徴とする AutoRDF2GML により、RDF や SPARQL にあまり詳しくないユーザーでも、リンク予測、ノード分類、グラフ分類などのグラフ機械学習タスクに対応できるデータ表現を生成できます。
さらに、フレームワークを使用して大規模な RDF ナレッジ グラフから作成された、グラフ機械学習用の 4 つの新しいベンチマーク データセットを紹介します。
これらのデータセットは、グラフ ニューラル ネットワークなどのグラフ機械学習アプローチを評価するための貴重なリソースとして機能します。
全体として、私たちのフレームワークはグラフ機械学習コミュニティとセマンティック Web コミュニティの間のギャップを効果的に橋渡しし、RDF ベースの機械学習アプリケーションへの道を開きます。


In this paper, we introduce AutoRDF2GML, a framework designed to convert RDF data into data representations tailored for graph machine learning tasks. AutoRDF2GML enables, for the first time, the creation of both content-based features — i.e., features based on RDF datatype properties — and topology-based features — i.e., features based on RDF object properties. Characterized by automated feature extraction, AutoRDF2GML makes it possible even for users less familiar with RDF and SPARQL to generate data representations ready for graph machine learning tasks, such as link prediction, node classification, and graph classification. Furthermore, we present four new benchmark datasets for graph machine learning, created from large RDF knowledge graphs using our framework. These datasets serve as valuable resources for evaluating graph machine learning approaches, such as graph neural networks. Overall, our framework effectively bridges the gap between the Graph Machine Learning and Semantic Web communities, paving the way for RDF-based machine learning applications.


著者 Michael Färber,David Lamprecht,Yuni Susanti
発行日 2024-07-26 13:44:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.IR, cs.LG パーマリンク