Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model

要約

材料科学の知識は広範な科学文献に広く分散されており、新材料の効率的な発見と統合には大きな課題が生じています。
従来の方法は、費用と時間がかかる実験的アプローチに依存することが多く、急速なイノベーションをさらに複雑にしています。
これらの課題に対処するために、人工知能と材料科学の統合により、発見プロセスを加速する道が開かれましたが、正確な注釈、データ抽出、情報の追跡可能性も必要となります。
これらの問題に取り組むために、この記事ではマテリアル ナレッジ グラフ (MKG) を紹介します。これは、高度な自然言語処理技術を利用し、大規模な言語モデルと統合して、構造化トリプルに関する 10 年に相当する高品質の研究を抽出して体系的に整理します。
731,772 エッジ。
MKG は、情報を名前、式、アプリケーションなどの包括的なラベルに分類し、綿密に設計されたオントロジーに基づいて構造化することで、データの使いやすさと統合を強化します。
ネットワークベースのアルゴリズムを実装することにより、MKG は効率的なリンク予測を容易にするだけでなく、従来の実験的手法への依存を大幅に軽減します。
この構造化されたアプローチは、材料研究を合理化するだけでなく、より洗練された科学知識グラフの基礎も築きます。

要約(オリジナル)

Knowledge in materials science is widely dispersed across extensive scientific literature, posing significant challenges for efficient discovery and integration of new materials. Traditional methods, often reliant on costly and time-consuming experimental approaches, further complicate rapid innovation. Addressing these challenges, the integration of artificial intelligence with materials science has opened avenues for accelerating the discovery process, though it also demands precise annotation, data extraction, and traceability of information. To tackle these issues, this article introduces the Materials Knowledge Graph (MKG), which utilizes advanced natural language processing techniques, integrated with large language models to extract and systematically organize a decade’s worth of high-quality research into structured triples, contains 162,605 nodes and 731,772 edges. MKG categorizes information into comprehensive labels such as Name, Formula, and Application, structured around a meticulously designed ontology, thus enhancing data usability and integration. By implementing network-based algorithms, MKG not only facilitates efficient link prediction but also significantly reduces reliance on traditional experimental methods. This structured approach not only streamlines materials research but also lays the groundwork for more sophisticated science knowledge graphs.

arxiv情報

著者 Yanpeng Ye,Jie Ren,Shaozhou Wang,Yuwei Wan,Haofen Wang,Imran Razzak,Bram Hoex,Tong Xie,Wenjie Zhang
発行日 2024-09-30 13:46:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク