log-RRIM: Yield Prediction via Local-to-global Reaction Representation Learning and Interaction Modeling

要約

化学反応の収率を正確に予測することは、有機合成を最適化するために非常に重要であり、実験に費やす時間とリソースを削減できる可能性があります。
人工知能 (AI) の台頭により、AI ベースの手法を活用して、体外実験を行わずに収量予測を加速することへの関心が高まっています。
化学反応収率を予測するために設計された革新的なグラフ変換ベースのフレームワークである log-RRIM を紹介します。
私たちのアプローチは、ローカルからグローバルへの独自の反応表現学習戦略を実装しています。
このアプローチでは、最初に詳細な分子レベルの情報を取得し、次に分子間相互作用をモデル化および集計して、さまざまなサイズの分子フラグメントが収量に与える影響を正確に考慮します。
log-RRIM のもう 1 つの重要な特徴は、試薬と反応中心の間の相互作用に焦点を当てたクロスアテンション メカニズムの統合です。
この設計は、化学反応の基本原理、つまり、最終的に反応収率に影響を及ぼす結合切断および形成プロセスに影響を与える試薬の重要な役割を反映しています。
log-RRIM は、特に中収率から高収率の反応において、我々の実験において既存の方法を上回っており、予測因子としての信頼性を証明しています。
反応物と試薬の相互作用の高度なモデリングと小分子フラグメントに対する感度により、化学合成における反応計画と最適化のための貴重なツールとなります。
log-RRIM のデータとコードには、https://github.com/ninglab/Yield_log_RRIM からアクセスできます。

要約(オリジナル)

Accurate prediction of chemical reaction yields is crucial for optimizing organic synthesis, potentially reducing time and resources spent on experimentation. With the rise of artificial intelligence (AI), there is growing interest in leveraging AI-based methods to accelerate yield predictions without conducting in vitro experiments. We present log-RRIM, an innovative graph transformer-based framework designed for predicting chemical reaction yields. Our approach implements a unique local-to-global reaction representation learning strategy. This approach initially captures detailed molecule-level information and then models and aggregates intermolecular interactions, ensuring that the impact of varying-sizes molecular fragments on yield is accurately accounted for. Another key feature of log-RRIM is its integration of a cross-attention mechanism that focuses on the interplay between reagents and reaction centers. This design reflects a fundamental principle in chemical reactions: the crucial role of reagents in influencing bond-breaking and formation processes, which ultimately affect reaction yields. log-RRIM outperforms existing methods in our experiments, especially for medium to high-yielding reactions, proving its reliability as a predictor. Its advanced modeling of reactant-reagent interactions and sensitivity to small molecular fragments make it a valuable tool for reaction planning and optimization in chemical synthesis. The data and codes of log-RRIM are accessible through https://github.com/ninglab/Yield_log_RRIM.

arxiv情報

著者 Xiao Hu,Ziqi Chen,Bo Peng,Daniel Adu-Ampratwum,Xia Ning
発行日 2024-11-19 16:49:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.BM パーマリンク