Accurate and efficient structure elucidation from routine one-dimensional NMR spectra using multitask machine learning

要約

分子構造を迅速に決定することで、多くの化学分野にわたるワークフローを大幅に加速できます。
しかし、最も容易にアクセスできるデータである一次元 (1D) NMR スペクトルのみを使用して構造を解明することは、構成原子の数が増加するにつれて可能な分子の数が組み合わせ爆発的に増加するため、極めて困難な問題のままです。
ここでは、1D 1H および/または 13C NMR スペクトルのみに基づいて未知の化合物の分子構造 (式と結合性) を予測するマルチタスク機械学習フレームワークを紹介します。
まず、従来化学者が行っていた、多数の分子断片を分子構造に組み立てる作業を効率的に解決するために、トランス構造を構築する方法を示します。
この機能を畳み込みニューラル ネットワーク (CNN) と統合することで、スペクトルから構造を高速かつ正確に予測するためのエンドツーエンドのモデルを構築します。
私たちは、最大 19 個の重 (非水素) 原子を含む分子に対するこのフレームワークの有効性を実証します。このサイズには、可能な構造が数兆個存在します。
分子式などの事前の化学知識に依存することなく、このアプローチが最初の 15 予測内で 69.6% の確率で正確な分子を予測し、検索スペースが最大 11 桁減少することを示します。

要約(オリジナル)

Rapid determination of molecular structures can greatly accelerate workflows across many chemical disciplines. However, elucidating structure using only one-dimensional (1D) NMR spectra, the most readily accessible data, remains an extremely challenging problem because of the combinatorial explosion of the number of possible molecules as the number of constituent atoms is increased. Here, we introduce a multitask machine learning framework that predicts the molecular structure (formula and connectivity) of an unknown compound solely based on its 1D 1H and/or 13C NMR spectra. First, we show how a transformer architecture can be constructed to efficiently solve the task, traditionally performed by chemists, of assembling large numbers of molecular fragments into molecular structures. Integrating this capability with a convolutional neural network (CNN), we build an end-to-end model for predicting structure from spectra that is fast and accurate. We demonstrate the effectiveness of this framework on molecules with up to 19 heavy (non-hydrogen) atoms, a size for which there are trillions of possible structures. Without relying on any prior chemical knowledge such as the molecular formula, we show that our approach predicts the exact molecule 69.6% of the time within the first 15 predictions, reducing the search space by up to 11 orders of magnitude.

arxiv情報

著者 Frank Hu,Michael S. Chen,Grant M. Rotskoff,Matthew W. Kanan,Thomas E. Markland
発行日 2024-08-15 17:37:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph パーマリンク