Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model

要約

材料科学の知識は、広範な科学文献全体に広く分散されており、新しい材料の効率的な発見と統合に大きな課題をもたらしています。
多くの場合、費用と時間のかかる実験的アプローチに依存している従来の方法は、急速な革新をさらに複雑にします。
これらの課題に対処するために、人工知能と材料科学の統合は、発見プロセスを加速するための道を開きましたが、情報の正確な注釈、データ抽出、およびトレーサビリティも必要です。
これらの問題に取り組むために、この記事では、材料知識グラフ(MKG)を紹介します。これは、大規模な言語モデルと統合された高度な自然言語処理技術を利用して、162,605ノードと731,772のエッジを含む10年分の高品質の研究を抽出し、体系的に編成します。
MKGは、細心の注意を払って設計されたオントロジーを中心に構成された名前、式、アプリケーションなどの包括的なラベルに情報を分類し、データの使いやすさと統合を強化します。
ネットワークベースのアルゴリズムを実装することにより、MKGは効率的なリンク予測を促進するだけでなく、従来の実験方法への依存を大幅に削減します。
この構造化されたアプローチは、材料の研究を合理化するだけでなく、より洗練された科学知識グラフの基礎を築きます。

要約(オリジナル)

Knowledge in materials science is widely dispersed across extensive scientific literature, posing significant challenges to the efficient discovery and integration of new materials. Traditional methods, often reliant on costly and time-consuming experimental approaches, further complicate rapid innovation. Addressing these challenges, the integration of artificial intelligence with materials science has opened avenues for accelerating the discovery process, though it also demands precise annotation, data extraction, and traceability of information. To tackle these issues, this article introduces the Materials Knowledge Graph (MKG), which utilizes advanced natural language processing techniques integrated with large language models to extract and systematically organize a decade’s worth of high-quality research into structured triples, contains 162,605 nodes and 731,772 edges. MKG categorizes information into comprehensive labels such as Name, Formula, and Application, structured around a meticulously designed ontology, thus enhancing data usability and integration. By implementing network-based algorithms, MKG not only facilitates efficient link prediction but also significantly reduces reliance on traditional experimental methods. This structured approach not only streamlines materials research but also lays the groundwork for more sophisticated science knowledge graphs.

arxiv情報

著者 Yanpeng Ye,Jie Ren,Shaozhou Wang,Yuwei Wan,Imran Razzak,Bram Hoex,Haofen Wang,Tong Xie,Wenjie Zhang
発行日 2025-05-15 02:03:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク