Open Materials Generation with Stochastic Interpolants


新しい材料の発見は、技術の進歩を可能にするために不可欠である。新規材料を予測するための計算機的アプローチは、無限の設計空間の中で安定な結晶構造の多様体を効果的に学習する必要がある。我々は、無機結晶材料の生成的設計と発見のための統一的フレームワークであるOpen Materials Generation (OMG)を紹介する。OMGは、拡散モデルとフローマッチングを特別なケースとして包含する幅広いクラスの調整可能な確率過程を介して、任意の基本分布を無機結晶の目標分布に橋渡しする確率的補間(SI)を採用している。本研究では、結晶構造の等変量グラフ表現を統合し、単位胞表現における周期的境界条件を考慮するように拡張することで、SIフレームワークを適応する。さらに、空間座標と格子ベクトル上のSIフローを原子種の離散フローマッチングと結合する。OMGの性能を2つのタスクでベンチマークした:指定された組成に対する結晶構造予測(CSP)と、安定で新規かつユニークな構造の発見を目的とした「de novo」生成(DNG)である。OMGのグランドアップ実装において、我々はCSPとDNGの両方のメトリクスの改良と拡張を行った。OMGは、純粋なフローベースや拡散ベースの実装を凌駕し、材料探索のためのジェネレーティブモデリングにおける新たな最先端を確立した。これらの結果は、材料科学の進歩を加速するために、柔軟な深層学習フレームワークを設計することの重要性を強調している。


The discovery of new materials is essential for enabling technological advancements. Computational approaches for predicting novel materials must effectively learn the manifold of stable crystal structures within an infinite design space. We introduce Open Materials Generation (OMG), a unifying framework for the generative design and discovery of inorganic crystalline materials. OMG employs stochastic interpolants (SI) to bridge an arbitrary base distribution to the target distribution of inorganic crystals via a broad class of tunable stochastic processes, encompassing both diffusion models and flow matching as special cases. In this work, we adapt the SI framework by integrating an equivariant graph representation of crystal structures and extending it to account for periodic boundary conditions in unit cell representations. Additionally, we couple the SI flow over spatial coordinates and lattice vectors with discrete flow matching for atomic species. We benchmark OMG’s performance on two tasks: Crystal Structure Prediction (CSP) for specified compositions, and ‘de novo’ generation (DNG) aimed at discovering stable, novel, and unique structures. In our ground-up implementation of OMG, we refine and extend both CSP and DNG metrics compared to previous works. OMG establishes a new state-of-the-art in generative modeling for materials discovery, outperforming purely flow-based and diffusion-based implementations. These results underscore the importance of designing flexible deep learning frameworks to accelerate progress in materials science.


著者 Philipp Hoellmer,Thomas Egg,Maya M. Martirossyan,Eric Fuemmeler,Amit Gupta,Zeren Shui,Pawan Prakash,Adrian Roitberg,Mingjie Liu,George Karypis,Mark Transtrum,Richard G. Hennig,Ellad B. Tadmor,Stefano Martiniani
発行日 2025-02-04 18:56:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cond-mat.mtrl-sci, cs.LG パーマリンク