要約
文献からの金属有機フレームワーク(MOFS)合成ルートの抽出は、望ましい機能を備えた論理MOFS設計にとって非常に重要です。
最近の大規模な言語モデル(LLMS)の出現は、この長年の問題に対する破壊的に新しい解決策を提供します。
最新の研究は主に専門的な物質的知識を欠いている原始的なゼロショットLLMに固執していますが、この作業では、少数のLLMコンテキスト学習パラダイムを紹介します。
まず、高品質のデモンストレーションを確保するために、人間のInteractive Data Curationアプローチが提案されています。
第二に、情報検索アルゴリズムが適用され、各抽出の少数のショットデモンストレーションを選択および定量化します。
ほぼ90,000の明確に定義されたMOFからランダムにサンプリングされた3つのデータセットを超えると、トリプル評価を実施して、メソッドを検証します。
提案されている少数のLLMの合成抽出、構造推論、および材料設計パフォーマンスはすべて、ゼロショットLLMおよびベースラインメソッドを大幅に上回っています。
LLMに導かれたラボ合成材料は、特定の表面積の主要な物理的特性について、文献で報告されている同じクラスの高品質のMOF 91.1%を超えています。
要約(オリジナル)
The extraction of Metal-Organic Frameworks (MOFs) synthesis route from literature has been crucial for the logical MOFs design with desirable functionality. The recent advent of large language models (LLMs) provides disruptively new solution to this long-standing problem. While the latest researches mostly stick to primitive zero-shot LLMs lacking specialized material knowledge, we introduce in this work the few-shot LLM in-context learning paradigm. First, a human-AI interactive data curation approach is proposed to secure high-quality demonstrations. Second, an information retrieval algorithm is applied to pick and quantify few-shot demonstrations for each extraction. Over three datasets randomly sampled from nearly 90,000 well-defined MOFs, we conduct triple evaluations to validate our method. The synthesis extraction, structure inference, and material design performance of the proposed few-shot LLMs all significantly outplay zero-shot LLM and baseline methods. The lab-synthesized material guided by LLM surpasses 91.1% high-quality MOFs of the same class reported in the literature, on the key physical property of specific surface area.
arxiv情報
著者 | Lei Shi,Zhimeng Liu,Yi Yang,Weize Wu,Yuyang Zhang,Hongbo Zhang,Jing Lin,Siyu Wu,Zihan Chen,Ruiming Li,Nan Wang,Zipeng Liu,Huobin Tan,Hongyi Gao,Yue Zhang,Ge Wang |
発行日 | 2025-02-25 15:20:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google