要約
私たちは、科学出版物とその関連エンティティ (著者、機関、ジャーナル、概念など) に関する 260 億を超えるトリプルを含む広範な RDF ナレッジ グラフである SemOpenAlex を紹介します。
SemOpenAlex は CC0 に基づいてライセンスされており、データへの無料かつオープンなアクセスを提供します。
当社は、RDF ダンプ ファイル、SPARQL エンドポイントを含む複数のチャネルを通じてデータを提供し、解決可能な URI と他のデータ ソースへのリンクを備えた Linked Open Data クラウドのデータ ソースとしてデータを提供します。
さらに、ハイパフォーマンス コンピューティングを使用してナレッジ グラフ エンティティの埋め込みを提供します。
SemOpenAlex は、Web サイトを介した探索的セマンティック検索、大規模な科学的影響の定量化、科学分野内および科学分野全体にわたるその他の形式の学術ビッグデータ分析など、幅広いユースケース シナリオを可能にします。
さらに、説明可能性機能を含む、協力者、出版物、会場の推薦などの学術推薦システムも有効になります。
最後に、SemOpenAlex は、RDF クエリ最適化ベンチマークとして機能し、学術知識に基づいた言語モデルを作成し、セマンティックな科学出版のハブとして機能します。
要約(オリジナル)
We present SemOpenAlex, an extensive RDF knowledge graph that contains over 26 billion triples about scientific publications and their associated entities, such as authors, institutions, journals, and concepts. SemOpenAlex is licensed under CC0, providing free and open access to the data. We offer the data through multiple channels, including RDF dump files, a SPARQL endpoint, and as a data source in the Linked Open Data cloud, complete with resolvable URIs and links to other data sources. Moreover, we provide embeddings for knowledge graph entities using high-performance computing. SemOpenAlex enables a broad range of use-case scenarios, such as exploratory semantic search via our website, large-scale scientific impact quantification, and other forms of scholarly big data analytics within and across scientific disciplines. Additionally, it enables academic recommender systems, such as recommending collaborators, publications, and venues, including explainability capabilities. Finally, SemOpenAlex can serve for RDF query optimization benchmarks, creating scholarly knowledge-guided language models, and as a hub for semantic scientific publishing.
arxiv情報
| 著者 | Michael Färber,David Lamprecht,Johan Krause,Linn Aung,Peter Haase |
| 発行日 | 2023-08-07 15:46:39+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google