要約
分散分布特性を備えた新規分子を生成することは、分子発見における大きな課題です。
監視された学習方法は、データセットのものと同様の高品質の分子を生成しますが、分散分布特性に一般化するのに苦労しています。
補強学習は新しい化学スペースを探索できますが、多くの場合「報酬ハッキング」を行い、同様ではない分子を生成します。
この作業では、最先端の監視学習方法であるSTGG+をアクティブな学習ループに統合することにより、この問題に対処します。
当社のアプローチは、stgg+を繰り返し生成、評価、および微調整して、知識を継続的に拡大します。
このアプローチSTGG+ALを示します。
stgg+alを有機$ \ pi $機能材料、特に2つの挑戦的なタスクの設計に適用します。1)高発振器強度と2)近接した合理的な発振器強度を持つ吸収分子を設計する高度に吸収性分子を生成する
nir)範囲。
生成された分子は、時間依存性密度官能理論を備えたシリコ内で検証され、合理化されています。
我々の結果は、私たちの方法が、強化学習(RL)方法などの既存の方法に反して、発振器強度の高い新しい分子を生成するのに非常に効果的であることを示しています。
アクティブラーニングコードと、290万ドルの$ \ PI $結合分子を含む共役-XTBデータセットと、発振器強度と吸収波長(STDA-XTBに基づく)を近似する機能を含む共役-XTBデータセットをオープンソースします。
要約(オリジナル)
Generating novel molecules with out-of-distribution properties is a major challenge in molecular discovery. While supervised learning methods generate high-quality molecules similar to those in a dataset, they struggle to generalize to out-of-distribution properties. Reinforcement learning can explore new chemical spaces but often conducts ‘reward-hacking’ and generates non-synthesizable molecules. In this work, we address this problem by integrating a state-of-the-art supervised learning method, STGG+, in an active learning loop. Our approach iteratively generates, evaluates, and fine-tunes STGG+ to continuously expand its knowledge. We denote this approach STGG+AL. We apply STGG+AL to the design of organic $\pi$-functional materials, specifically two challenging tasks: 1) generating highly absorptive molecules characterized by high oscillator strength and 2) designing absorptive molecules with reasonable oscillator strength in the near-infrared (NIR) range. The generated molecules are validated and rationalized in-silico with time-dependent density functional theory. Our results demonstrate that our method is highly effective in generating novel molecules with high oscillator strength, contrary to existing methods such as reinforcement learning (RL) methods. We open-source our active-learning code along with our Conjugated-xTB dataset containing 2.9 million $\pi$-conjugated molecules and the function for approximating the oscillator strength and absorption wavelength (based on sTDA-xTB).
arxiv情報
著者 | Alexia Jolicoeur-Martineau,Yan Zhang,Boris Knyazev,Aristide Baratin,Cheng-Hao Liu |
発行日 | 2025-02-20 18:52:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google