A Unified Approach to Inferring Chemical Compounds with the Desired Aqueous Solubility

要約

水溶解度 (AS) は、創薬や材料設計において重要な役割を果たす重要な物理化学的特性です。
我々は、単純な決定論的グラフ理論記述子、重線形回帰(MLR)および混合整数線形計画法(MILP)に基づいて、目的のASを持つ化合物を予測および推論するための新しい統一アプローチを報告します。
順方向ステップワイズ手順に基づいて選択された記述子により、最も単純な回帰モデル MLR は、既存のアプローチと比較して大幅に優れた予測精度を達成することができ、29 の多様なデータセットに対して [0.7191, 0.9377] の範囲の精度を達成しました。
これらの記述子と学習モデルを MILP としてシミュレートすることにより、適切な時間範囲 [6, 1204] 秒で、目的の AS、規定の構造、および最大 50 個の非水素原子を備えた数学的に正確で最適な化合物を推測しました。
これらの発見は、単純なグラフ理論記述子と化合物の AS の間に強い相関関係があることを示しており、広く使用されている複雑な化学記述子や、計算コストが高く、したがって実行が困難な複雑な機械学習モデルに依存することなく、AS のより深い理解につながる可能性があります。
推論に使用します。
提案されたアプローチの実装は、https://github.com/ku-dml/mol-infer/tree/master/AqSol で入手できます。

要約(オリジナル)

Aqueous solubility (AS) is a key physiochemical property that plays a crucial role in drug discovery and material design. We report a novel unified approach to predict and infer chemical compounds with the desired AS based on simple deterministic graph-theoretic descriptors, multiple linear regression (MLR) and mixed integer linear programming (MILP). Selected descriptors based on a forward stepwise procedure enabled the simplest regression model, MLR, to achieve significantly good prediction accuracy compared to the existing approaches, achieving the accuracy in the range [0.7191, 0.9377] for 29 diverse datasets. By simulating these descriptors and learning models as MILPs, we inferred mathematically exact and optimal compounds with the desired AS, prescribed structures, and up to 50 non-hydrogen atoms in a reasonable time range [6, 1204] seconds. These findings indicate a strong correlation between the simple graph-theoretic descriptors and the AS of compounds, potentially leading to a deeper understanding of their AS without relying on widely used complicated chemical descriptors and complex machine learning models that are computationally expensive, and therefore difficult to use for inference. An implementation of the proposed approach is available at https://github.com/ku-dml/mol-infer/tree/master/AqSol.

arxiv情報

著者 Muniba Batool,Naveed Ahmed Azam,Jianshen Zhu,Kazuya Haraguchi,Liang Zhao,Tatsuya Akutsu
発行日 2024-09-06 14:20:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DM, cs.LG パーマリンク