要約
最適化の問題として定式化された場合、最適化目標は非拡張不可能である可能性があるため、重要な計算上の課題を提示します。
分子発見におけるブラックボックスの目標を最適化するためによく使用される進化アルゴリズム(EAS)は、ランダムな突然変異とクロスオーバーを実行することにより化学空間を横断し、多数の高価な目的評価につながります。
この作業では、化学に対応する大手言語モデル(LLM)をEASに組み込むことにより、この欠点を改善します。
つまり、大規模な化学情報でトレーニングされたLLMSを使用して、EASのクロスオーバーおよび突然変異操作を再設計します。
私たちは、プロパティの最適化、分子再発見、および構造ベースの薬物設計を含む複数のタスクで、商用モデルとオープンソースモデルの両方で広範な経験的研究を実施し、EASのLLMSの共同使用が単一および多目的設定にわたってすべてのベースラインモデルで優れたパフォーマンスをもたらすことを示しています。
アルゴリズムが最終的なソリューションの品質と収束速度の両方を改善し、それにより必要な客観的評価の数を減らすことを実証します。
私たちのコードは、http://github.com/zoom-wang112358/molleoで入手できます
要約(オリジナル)
Molecular discovery, when formulated as an optimization problem, presents significant computational challenges because optimization objectives can be non-differentiable. Evolutionary Algorithms (EAs), often used to optimize black-box objectives in molecular discovery, traverse chemical space by performing random mutations and crossovers, leading to a large number of expensive objective evaluations. In this work, we ameliorate this shortcoming by incorporating chemistry-aware Large Language Models (LLMs) into EAs. Namely, we redesign crossover and mutation operations in EAs using LLMs trained on large corpora of chemical information. We perform extensive empirical studies on both commercial and open-source models on multiple tasks involving property optimization, molecular rediscovery, and structure-based drug design, demonstrating that the joint usage of LLMs with EAs yields superior performance over all baseline models across single- and multi-objective settings. We demonstrate that our algorithm improves both the quality of the final solution and convergence speed, thereby reducing the number of required objective evaluations. Our code is available at http://github.com/zoom-wang112358/MOLLEO
arxiv情報
著者 | Haorui Wang,Marta Skreta,Cher-Tian Ser,Wenhao Gao,Lingkai Kong,Felix Strieth-Kalthoff,Chenru Duan,Yuchen Zhuang,Yue Yu,Yanqiao Zhu,Yuanqi Du,Alán Aspuru-Guzik,Kirill Neklyudov,Chao Zhang |
発行日 | 2025-03-07 17:24:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google