要約
分子表現は、物理世界を理解する上での基礎的な要素です。
その重要性は、化学反応の基礎から新しい治療法や材料の設計にまで及びます。
これまでの分子機械学習モデルでは、文字列、フィンガープリント、グローバル特徴、および本質的に情報が希薄な表現である単純な分子グラフが使用されていました。
ただし、予測タスクの複雑さが増すにつれて、分子表現はより忠実度の高い情報をエンコードする必要があります。
この研究では、立体電子効果を介して量子化学に富んだ情報を分子グラフに注入する新しいアプローチを導入しています。
立体電子相互作用を明示的に追加すると、分子機械学習モデルのパフォーマンスが大幅に向上することを示します。
さらに、ステレオエレクトロニクスを注入した表現は、カスタマイズされたダブル グラフ ニューラル ネットワーク ワークフローで学習および展開できるため、下流の分子機械学習タスクへの適用が可能になります。
最後に、学習した表現によって、タンパク質全体など、以前は扱いにくかったシステムの容易な立体電子評価が可能になり、分子設計の新しい道が開かれることを示します。
要約(オリジナル)
Molecular representation is a foundational element in our understanding of the physical world. Its importance ranges from the fundamentals of chemical reactions to the design of new therapies and materials. Previous molecular machine learning models have employed strings, fingerprints, global features, and simple molecular graphs that are inherently information-sparse representations. However, as the complexity of prediction tasks increases, the molecular representation needs to encode higher fidelity information. This work introduces a novel approach to infusing quantum-chemical-rich information into molecular graphs via stereoelectronic effects. We show that the explicit addition of stereoelectronic interactions significantly improves the performance of molecular machine learning models. Furthermore, stereoelectronics-infused representations can be learned and deployed with a tailored double graph neural network workflow, enabling its application to any downstream molecular machine learning task. Finally, we show that the learned representations allow for facile stereoelectronic evaluation of previously intractable systems, such as entire proteins, opening new avenues of molecular design.
arxiv情報
著者 | Daniil A. Boiko,Thiago Reschützegger,Benjamin Sanchez-Lengeling,Samuel M. Blau,Gabe Gomes |
発行日 | 2024-08-08 15:21:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google