Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models

要約

望ましい特性を持つ新しい材料を発見する能力は、気候変動の緩和から次世代コンピューティング ハードウェアの進歩に至るまで、多くの用途にとって重要です。
AI は、他の計算手法と比較して化学空間をより効果的に探索したり、試行錯誤したりすることで、材料の発見と設計を加速する可能性があります。
材料データ、ベンチマーク、モデルの AI に関しては大幅な進歩が見られましたが、出現した障壁は、公的に利用可能なトレーニング データとオープンな事前トレーニング済みモデルの不足です。
これに対処するために、Open Materials 2024 (OMat24) 大規模オープン データセットとそれに付随する事前トレーニング済みモデルのセットの Meta FAIR リリースを紹介します。
OMat24 には、構造および組成の多様性に焦点を当てた 1 億 1,000 万を超える密度汎関数理論 (DFT) 計算が含まれています。
当社の EquiformerV2 モデルは、Matbench Discovery リーダーボードで最先端のパフォーマンスを達成し、基底状態の安定性と地層エネルギーをそれぞれ 0.9 を超える F1 スコアと 20 meV/原子の精度で予測できます。
OMat24、MPtraj、Alexandria などのさまざまなデータセットにわたって、モデル サイズ、補助ノイズ除去目標、およびパフォーマンスに対する微調整の影響を調査します。
OMat24 データセットとモデルのオープン リリースにより、研究コミュニティは私たちの取り組みを基盤にして、AI 支援材料科学のさらなる進歩を推進することができます。

要約(オリジナル)

The ability to discover new materials with desirable properties is critical for numerous applications from helping mitigate climate change to advances in next generation computing hardware. AI has the potential to accelerate materials discovery and design by more effectively exploring the chemical space compared to other computational methods or by trial-and-error. While substantial progress has been made on AI for materials data, benchmarks, and models, a barrier that has emerged is the lack of publicly available training data and open pre-trained models. To address this, we present a Meta FAIR release of the Open Materials 2024 (OMat24) large-scale open dataset and an accompanying set of pre-trained models. OMat24 contains over 110 million density functional theory (DFT) calculations focused on structural and compositional diversity. Our EquiformerV2 models achieve state-of-the-art performance on the Matbench Discovery leaderboard and are capable of predicting ground-state stability and formation energies to an F1 score above 0.9 and an accuracy of 20 meV/atom, respectively. We explore the impact of model size, auxiliary denoising objectives, and fine-tuning on performance across a range of datasets including OMat24, MPtraj, and Alexandria. The open release of the OMat24 dataset and models enables the research community to build upon our efforts and drive further advancements in AI-assisted materials science.

arxiv情報

著者 Luis Barroso-Luque,Muhammed Shuaibi,Xiang Fu,Brandon M. Wood,Misko Dzamba,Meng Gao,Ammar Rizvi,C. Lawrence Zitnick,Zachary W. Ulissi
発行日 2024-10-16 17:48:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.AI, physics.comp-ph パーマリンク