Materials Discovery with Extreme Properties via AI-Driven Combinatorial Chemistry

要約

ほとんどの物質発見の目標は、現在知られている物質よりも優れた物質を発見することです。
基本的に、これは外挿に近く、データの確率分布を学習するほとんどの機械学習モデルの弱点です。
ここでは、データに依存しないルールベースの逆分子デザイナーである AI ドリブン コンビナトリアル ケミストリーを開発します。
私たちのモデルは、分子断片の組み合わせから得られるあらゆる分子構造を生成できる可能性を秘めているため、優れた特性を持つ未知の物質を発見することができます。
私たちのモデルは、確率分布学習モデルよりも優れた材料を発見するのに適していることを理論的および経験的に示しています。
7 つのターゲット プロパティにヒットする分子を発見することを目的とした実験では、100,000 回の試行から、ターゲットにヒットするすべての分子のうち 1,315 個、5 つのターゲットにヒットする分子のうち 7,629 個を発見しましたが、確率分布学習モデルは失敗しました。
実際の問題でのパフォーマンスを説明するために、モデルが 2 つの実用的なアプリケーションでうまく機能することも示します。それは、タンパク質ドッキング材料と HIV 阻害剤の発見です。

要約(オリジナル)

The goal of most materials discovery is to discover materials that are superior to those currently known. Fundamentally, this is close to extrapolation, which is a weak point for most machine learning models that learn the probability distribution of data. Herein, we develop AI-driven combinatorial chemistry, which is a rule-based inverse molecular designer that does not rely on data. Since our model has the potential to generate all possible molecular structures that can be obtained from combinations of molecular fragments, unknown materials with superior properties can be discovered. We theoretically and empirically demonstrate that our model is more suitable for discovering better materials than probability distribution-learning models. In an experiment aimed at discovering molecules that hit seven target properties, our model discovered 1,315 of all target-hitting molecules and 7,629 of five target-hitting molecules out of 100,000 trials, whereas the probability distribution-learning models failed. To illustrate the performance in actual problems, we also demonstrate that our models work well on two practical applications: discovering protein docking materials and HIV inhibitors.

arxiv情報

著者 Hyunseung Kim,Haeyeon Choi,Dongju Kang,Won Bo Lee,Jonggeol Na
発行日 2023-03-21 13:21:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク