polyGen: A Learning Framework for Atomic-level Polymer Structure Generation

要約

合成ポリマー材料は、エネルギー、電子機器、消費財、医療セクターの基本的な技術を支えていますが、その開発は依然として長期にわたる設計のタイムラインに苦しんでいます。
ポリマー情報学ツールはスピードアップをサポートしていますが、ポリマーシミュレーションプロトコルは重大な課題に直面し続けています。ポリマー構造の立体構造の多様性を尊重する現実的な3D原子構造のオンデマンド生成です。
無機結晶、バイオポリマー、および小分子の3D構造の生成アルゴリズムは存在しますが、合成ポリマーには対処していません。
この作業では、リピートユニット化学のみなどの最小限の入力から現実的なポリマー構造を生成するために特別に設計された最初の潜在拡散モデルであるポリゲンを導入し、アーキテクチャ全体のポリマー接続をキャプチャする分子エンコードを活用します。
わずか3855のDFT最適化ポリマー構造のデータセットが少ないため、DFT最適化された分子構造でトレーニングを強化し、同様の化学構造間の共同学習の改善を示します。
また、この新しい問題に関するアプローチをベンチマークするために、構造マッチング基準を確立します。
ポリゲンは、線形鎖と複雑な分岐構造の両方の多様な立体構造を効果的に生成しますが、その性能は、アトムカウントが高い繰り返しユニットを処理すると低下します。
これらの最初の結果を考えると、ポリゲンはポリマーサイエンスの原子レベル構造生成のパラダイムシフトを表します。これは、本質的な構造の柔軟性を考慮しながら、現実的な原子レベルのポリマーの立体構造を予測するための最初の概念の証明です。

要約(オリジナル)

Synthetic polymeric materials underpin fundamental technologies in the energy, electronics, consumer goods, and medical sectors, yet their development still suffers from prolonged design timelines. Although polymer informatics tools have supported speedup, polymer simulation protocols continue to face significant challenges: on-demand generation of realistic 3D atomic structures that respect the conformational diversity of polymer structures. Generative algorithms for 3D structures of inorganic crystals, bio-polymers, and small molecules exist, but have not addressed synthetic polymers. In this work, we introduce polyGen, the first latent diffusion model designed specifically to generate realistic polymer structures from minimal inputs such as the repeat unit chemistry alone, leveraging a molecular encoding that captures polymer connectivity throughout the architecture. Due to a scarce dataset of only 3855 DFT-optimized polymer structures, we augment our training with DFT-optimized molecular structures, showing improvement in joint learning between similar chemical structures. We also establish structure matching criteria to benchmark our approach on this novel problem. polyGen effectively generates diverse conformations of both linear chains and complex branched structures, though its performance decreases when handling repeat units with a high atom count. Given these initial results, polyGen represents a paradigm shift in atomic-level structure generation for polymer science-the first proof-of-concept for predicting realistic atomic-level polymer conformations while accounting for their intrinsic structural flexibility.

arxiv情報

著者 Ayush Jain,Rampi Ramprasad
発行日 2025-04-24 15:26:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.CE, cs.LG パーマリンク