Cycle-Configuration: A Novel Graph-theoretic Descriptor Set for Molecular Inference

要約

この論文では、サイクル構成 (CC) と呼ばれる、化学グラフの新しい記述子のファミリーを提案します。このファミリーは、mol-infer の標準的な「2 層 (2L) モデル」で使用できます。mol-infer は、以下に基づく分子推論フレームワークです。
混合整数線形計画法 (MILP) と機械学習 (ML)。
提案された記述子は、芳香環に現れるオルト/メタ/パラパターンの概念を捉えていますが、これまでの枠組みでは不可能でした。
計算実験では、新しい記述子が提供されると、テストされた 27 の化学的特性すべてに対して同等またはより優れたパフォーマンスの予測関数を構築できることが示されています。
また、CC 記述子を備えた 2L モデル (2L+CC モデル) で必要な特性を備えた化学グラフを要求する MILP 定式化も提供します。
最大 50 個の非水素頂点を持つ化学グラフが実用的な時間で推論できることを示します。

要約(オリジナル)

In this paper, we propose a novel family of descriptors of chemical graphs, named cycle-configuration (CC), that can be used in the standard ‘two-layered (2L) model’ of mol-infer, a molecular inference framework based on mixed integer linear programming (MILP) and machine learning (ML). Proposed descriptors capture the notion of ortho/meta/para patterns that appear in aromatic rings, which has been impossible in the framework so far. Computational experiments show that, when the new descriptors are supplied, we can construct prediction functions of similar or better performance for all of the 27 tested chemical properties. We also provide an MILP formulation that asks for a chemical graph with desired properties under the 2L model with CC descriptors (2L+CC model). We show that a chemical graph with up to 50 non-hydrogen vertices can be inferred in a practical time.

arxiv情報

著者 Bowen Song,Jianshen Zhu,Naveed Ahmed Azam,Kazuya Haraguchi,Liang Zhao,Tatsuya Akutsu
発行日 2024-08-09 15:45:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク