Molecular Hypergraph Neural Networks

要約

グラフ ニューラル ネットワーク (GNN) は、さまざまな化学関連のタスクにわたって有望なパフォーマンスを実証しています。
しかし、従来のグラフは分子内のペア結合のみをモデル化しており、多中心結合や共役構造などの高次の結合を適切に表すことができません。
この課題に取り組むために、私たちは分子ハイパーグラフを導入し、ハイパーエッジが共役構造を表す有機半導体の光電子特性を予測する分子ハイパーグラフ ニューラル ネットワーク (MHNN) を提案します。
一般的なアルゴリズムは、不規則な高次結合用に設計されており、さまざまな次数のハイパーエッジを持つ分子ハイパーグラフ上で効率的に動作できます。
結果は、MHNN が OPV、OCELOTv1、および PCQM4Mv2 データセットのほとんどのタスクですべてのベースライン モデルよりも優れていることを示しています。
注目すべき点は、MHNN が 3D 幾何学的情報をまったく使用せずにこれを達成し、原子位置を利用するベースライン モデルを上回っていることです。
さらに、MHNN は限られたトレーニング データの下で事前トレーニングされた GNN よりも優れたパフォーマンスを達成し、その優れたデータ効率を強調しています。
この研究は、より一般的な分子表現と高次結合に関連する特性予測タスクのための新しい戦略を提供します。

要約(オリジナル)

Graph neural networks (GNNs) have demonstrated promising performance across various chemistry-related tasks. However, conventional graphs only model the pairwise connectivity in molecules, failing to adequately represent higher-order connections like multi-center bonds and conjugated structures. To tackle this challenge, we introduce molecular hypergraphs and propose Molecular Hypergraph Neural Networks (MHNN) to predict the optoelectronic properties of organic semiconductors, where hyperedges represent conjugated structures. A general algorithm is designed for irregular high-order connections, which can efficiently operate on molecular hypergraphs with hyperedges of various orders. The results show that MHNN outperforms all baseline models on most tasks of OPV, OCELOTv1 and PCQM4Mv2 datasets. Notably, MHNN achieves this without any 3D geometric information, surpassing the baseline model that utilizes atom positions. Moreover, MHNN achieves better performance than pretrained GNNs under limited training data, underscoring its excellent data efficiency. This work provides a new strategy for more general molecular representations and property prediction tasks related to high-order connections.

arxiv情報

著者 Junwu Chen,Philippe Schwaller
発行日 2023-12-20 15:56:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph パーマリンク