要約
組成から安定した結晶構造を生成することを目的とする結晶構造予測(CSP)は、新しい材料を発見するための重要な経路を表しています。
タンパク質などの他のドメインの構造予測タスクでは、顕著な進歩が見られますが、CSPは、結晶構造に固有のより複雑なジオメトリがあるため、比較的目立たない領域のままです。
この論文では、CSPに対処するために特別に設計されたシャム基礎モデルを提案します。
DAOという名前の私たちのプレレイン財政フレームワークは、2つの相補的な基礎モデルで構成されています。構造生成のDAO-Gとエネルギー予測のDAO-Pです。
CSPベンチマーク(MP-20およびMPTS-52)での実験は、DAO-Gがすべてのメトリックで最先端(SOTA)メソッドを大幅に上回っていることを示しています。
広範なアブレーション研究により、DAO-Gが多様な多型構造の生成に優れていることをさらに確認し、DAO-Pが提供するデータセットの緩和とエネルギーガイダンスがDAO-Gのパフォーマンスを向上させるために不可欠です。
3つの実世界の超伝導体($ \ text {csv} _3 \ text {sb} _5 $、$ \ text {zr} _ {16} \ text {rh} _8 \ text {o} _4 $ and and
$ \ text {zr} _ {16} \ text {pd} _8 \ text {o} _4 $)分析に挑戦することが知られている、基礎モデルは正確な重要な温度予測と構造の世代を実現します。
たとえば、$ \ text {csv} _3 \ text {sb} _5 $で、dao-gは、RMSEが0.0085の実験的な構造に近い構造を生成します。
DAO-Pは、高精度で$ T_C $の値を予測します(2.26 k対2.30 Kのグラウンドトゥルース値)。
対照的に、量子エスプレッソのような従来のDFT計算機は、許容時間内に最初の超伝導体の構造のみに成功裏に導き出されますが、RMSEはほぼ8倍大きく、計算速度は1000倍遅いです。
これらの説得力のある結果は、材料科学の研究開発を進めるための私たちのアプローチの可能性をまとめて強調しています。
要約(オリジナル)
Crystal Structure Prediction (CSP), which aims to generate stable crystal structures from compositions, represents a critical pathway for discovering novel materials. While structure prediction tasks in other domains, such as proteins, have seen remarkable progress, CSP remains a relatively underexplored area due to the more complex geometries inherent in crystal structures. In this paper, we propose Siamese foundation models specifically designed to address CSP. Our pretrain-finetune framework, named DAO, comprises two complementary foundation models: DAO-G for structure generation and DAO-P for energy prediction. Experiments on CSP benchmarks (MP-20 and MPTS-52) demonstrate that our DAO-G significantly surpasses state-of-the-art (SOTA) methods across all metrics. Extensive ablation studies further confirm that DAO-G excels in generating diverse polymorphic structures, and the dataset relaxation and energy guidance provided by DAO-P are essential for enhancing DAO-G’s performance. When applied to three real-world superconductors ($\text{CsV}_3\text{Sb}_5$, $ \text{Zr}_{16}\text{Rh}_8\text{O}_4$ and $\text{Zr}_{16}\text{Pd}_8\text{O}_4$) that are known to be challenging to analyze, our foundation models achieve accurate critical temperature predictions and structure generations. For instance, on $\text{CsV}_3\text{Sb}_5$, DAO-G generates a structure close to the experimental one with an RMSE of 0.0085; DAO-P predicts the $T_c$ value with high accuracy (2.26 K vs. the ground-truth value of 2.30 K). In contrast, conventional DFT calculators like Quantum Espresso only successfully derive the structure of the first superconductor within an acceptable time, while the RMSE is nearly 8 times larger, and the computation speed is more than 1000 times slower. These compelling results collectively highlight the potential of our approach for advancing materials science research and development.
arxiv情報
著者 | Liming Wu,Wenbing Huang,Rui Jiao,Jianxing Huang,Liwei Liu,Yipeng Zhou,Hao Sun,Yang Liu,Fuchun Sun,Yuxiang Ren,Jirong Wen |
発行日 | 2025-03-13 15:44:16+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google