Large Language Models as Master Key: Unlocking the Secrets of Materials Science with GPT

要約

タイトル:GPTによりマテリアルサイエンスの秘密を解き明かす:大規模自然言語処理モデルをマスターキーとして

要約:

– マテリアルサイエンス分野で、デバイスの性能に基づいて材料を評価する応用分野など、膨大なデータの有効活用に取り組むことが課題となっている。
– 著者らは、自然言語処理タスク「構造化情報推論(SII)」を提案し、GPT-3をチューニングして、既存のペロブスカイト太陽電池のFAIRデータセットに適用したところ、91.8%のF1スコアを達成した。
– 著者らは、新たにデータを追加し、そのデータをフォーマットして正規化することで、続くデータ分析に直接利用できるようにした。
– この機能により、マテリアルサイエンティストは、自分たちの分野内で高品質なレビュー論文を選択して、モデルを開発することが可能になる。
– 著者らは、大規模自然言語処理モデル(LLMs)を使用して、太陽電池の電気的性能を予測し、ターゲットパラメータを持つ材料やデバイスを設計する実験を行った。
– 著者らの結果は、特徴量選択なしでも従来の機械学習手法と同等の性能を示し、LLMsがマテリアルサイエンティストと同様に科学的知識を習得し、新しい材料を設計する可能性を高めていることを示唆する。

要約(オリジナル)

The amount of data has growing significance in exploring cutting-edge materials and a number of datasets have been generated either by hand or automated approaches. However, the materials science field struggles to effectively utilize the abundance of data, especially in applied disciplines where materials are evaluated based on device performance rather than their properties. This article presents a new natural language processing (NLP) task called structured information inference (SII) to address the complexities of information extraction at the device level in materials science. We accomplished this task by tuning GPT-3 on an existing perovskite solar cell FAIR (Findable, Accessible, Interoperable, Reusable) dataset with 91.8% F1-score and extended the dataset with data published since its release. The produced data is formatted and normalized, enabling its direct utilization as input in subsequent data analysis. This feature empowers materials scientists to develop models by selecting high-quality review articles within their domain. Additionally, we designed experiments to predict the electrical performance of solar cells and design materials or devices with targeted parameters using large language models (LLMs). Our results demonstrate comparable performance to traditional machine learning methods without feature selection, highlighting the potential of LLMs to acquire scientific knowledge and design new materials akin to materials scientists.

arxiv情報

著者 Tong Xie,Yuwei Wan,Wei Huang,Yufei Zhou,Yixuan Liu,Qingyuan Linghu,Shaozhou Wang,Chunyu Kit,Clara Grazian,Wenjie Zhang,Bram Hoex
発行日 2023-04-11 15:44:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL パーマリンク