DLGNet: Hyperedge Classification through Directed Line Graphs for Chemical Reactions

要約

グラフとハイパーグラフは、対象となる一連のエンティティ間の相互作用をモデル化するための強力な抽象化を提供し、いくつかの分野で多くの成功したアプリケーションのおかげで、文献での関心が高まっています。
特に化学や生物学などの分野、特に創薬や分子生成の分野で急速に拡大しています。
急速な成長が見られる分野の 1 つは化学反応分野であり、化学反応はハイパーグラフの有向ハイパーエッジとして自然にエンコードできます。
この論文では、特定の有向ハイパーグラフに関連付けられた有向線グラフ (DGL) の表記法を導入することで、化学反応の分類問題に取り組みます。
その上に、有向線グラフ ネットワーク (DLGNet) を構築します。これは、DLG 変換を介してハイパーグラフ上で動作するように明示的に設計された初のスペクトルベースのグラフ ニューラル ネットワーク (GNN) です。
DLGNet の基礎は、新しいエルミート行列である有向折れ線グラフ ラプラシアンです。これは、DLG 表現のおかげで、ハイパーグラフの有向ハイパーエッジ内で発生する相互作用の方向性をコンパクトにエンコードします。
有向折れ線グラフ ラプラシアンには、固有値分解の許容や正の半定値であるなど、多くの望ましい特性があり、スペクトルベースの GNN 内での採用に適しています。
化学反応データセットに関する広範な実験を通じて、DGLNet が既存のアプローチを大幅に上回り、実世界のデータセットのコレクションで平均相対パーセンテージ差 33.01% の改善、最大 37.71% の改善を達成したことを示しました。

要約(オリジナル)

Graphs and hypergraphs provide powerful abstractions for modeling interactions among a set of entities of interest and have been attracting a growing interest in the literature thanks to many successful applications in several fields. In particular, they are rapidly expanding in domains such as chemistry and biology, especially in the areas of drug discovery and molecule generation. One of the areas witnessing the fasted growth is the chemical reactions field, where chemical reactions can be naturally encoded as directed hyperedges of a hypergraph. In this paper, we address the chemical reaction classification problem by introducing the notation of a Directed Line Graph (DGL) associated with a given directed hypergraph. On top of it, we build the Directed Line Graph Network (DLGNet), the first spectral-based Graph Neural Network (GNN) expressly designed to operate on a hypergraph via its DLG transformation. The foundation of DLGNet is a novel Hermitian matrix, the Directed Line Graph Laplacian, which compactly encodes the directionality of the interactions taking place within the directed hyperedges of the hypergraph thanks to the DLG representation. The Directed Line Graph Laplacian enjoys many desirable properties, including admitting an eigenvalue decomposition and being positive semidefinite, which make it well-suited for its adoption within a spectral-based GNN. Through extensive experiments on chemical reaction datasets, we show that DGLNet significantly outperforms the existing approaches, achieving on a collection of real-world datasets an average relative-percentage-difference improvement of 33.01%, with a maximum improvement of 37.71%.

arxiv情報

著者 Stefano Fiorini,Giulia M. Bovolenta,Stefano Coniglio,Michele Ciavotta,Pietro Morerio,Michele Parrinello,Alessio Del Bue
発行日 2024-10-09 15:07:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク