AI-driven Hypergraph Network of Organic Chemistry: Network Statistics and Applications in Reaction Classification

要約

近年の新しい反応と分子の迅速な発見は、ハイスループットスクリーニングの進歩、はるかに複雑な化学設計空間へのアクセス、および正確な分子モデリングフレームワークの開発によって促進されています。
したがって、最近の傾向を理解し、それらを将来の可能性のある軌道に推定することに焦点を当てた、成長している化学文献の全体論的研究が必要です。
この目的のために、化学反応の有向グラフ表現を使用するいくつかのネットワーク理論に基づく研究が報告されています。
ここでは、ハイパーエッジが化学反応を表し、ノードが関与する分子を表すハイパーグラフとして化学反応を表すことに基づいて研究を行います。
標準的な反応データセットを使用してハイパーネットワークを構築し、次数分布、平均パス長、同類性または次数相関、PageRank 中心性、グラフベースのクラスター (またはコミュニティ) などの統計を報告します。
また、対応する反応の有向グラフ表現の各統計を計算して、類似点を描き、2 つの違いを強調します。
ハイパーグラフ反応表現の AI 適用性を実証するために、密なハイパーグラフ埋め込みを生成し、それらを反応分類問題で使用します。
ハイパーネットワーク表現は柔軟であり、反応のコンテキストを保持し、化学反応の従来の有向グラフ表現では明らかにされていない隠された洞察を明らかにすると結論付けています。

要約(オリジナル)

Rapid discovery of new reactions and molecules in recent years has been facilitated by the advancements in high throughput screening, accessibility to a much more complex chemical design space, and the development of accurate molecular modeling frameworks. A holistic study of the growing chemistry literature is, therefore, required that focuses on understanding the recent trends and extrapolating them into possible future trajectories. To this end, several network theory-based studies have been reported that use a directed graph representation of chemical reactions. Here, we perform a study based on representing chemical reactions as hypergraphs where the hyperedges represent chemical reactions and nodes represent the participating molecules. We use a standard reactions dataset to construct a hypernetwork and report its statistics such as degree distributions, average path length, assortativity or degree correlations, PageRank centrality, and graph-based clusters (or communities). We also compute each statistic for an equivalent directed graph representation of reactions to draw parallels and highlight differences between the two. To demonstrate the AI applicability of hypergraph reaction representation, we generate dense hypergraph embeddings and use them in the reaction classification problem. We conclude that the hypernetwork representation is flexible, preserves reaction context, and uncovers hidden insights that are otherwise not apparent in a traditional directed graph representation of chemical reactions.

arxiv情報

著者 Vipul Mann,Venkat Venkatasubramanian
発行日 2023-03-27 15:43:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.MN, q-bio.QM, stat.CO パーマリンク