要約
化学における基本的な課題である化学反応の予測には、特定の反応プロセスから生じる生成物の予測が含まれます。
従来の技術、特にグラフ ニューラル ネットワーク (GNN) を使用する技術は、トレーニング データが不十分でテキスト情報を利用できないことによって制限されることが多く、現実世界のアプリケーションでの適用性が損なわれています。
この研究では、言語モデル (LM) にエンコードされた化学知識を活用して GNN を支援し、それによって現実世界の化学反応予測の精度を向上させる新しいフレームワークである ReLM を提案します。
モデルの堅牢性と解釈可能性をさらに強化するために、信頼スコア戦略を組み込み、LM が予測の信頼性を自己評価できるようにします。
私たちの実験結果は、ReLM がさまざまな化学反応データセット、特に分布外設定において最先端の GNN ベースの手法のパフォーマンスを向上させることを示しています。
コードは https://github.com/syr-cn/ReLM で入手できます。
要約(オリジナル)
Predicting chemical reactions, a fundamental challenge in chemistry, involves forecasting the resulting products from a given reaction process. Conventional techniques, notably those employing Graph Neural Networks (GNNs), are often limited by insufficient training data and their inability to utilize textual information, undermining their applicability in real-world applications. In this work, we propose ReLM, a novel framework that leverages the chemical knowledge encoded in language models (LMs) to assist GNNs, thereby enhancing the accuracy of real-world chemical reaction predictions. To further enhance the model’s robustness and interpretability, we incorporate the confidence score strategy, enabling the LMs to self-assess the reliability of their predictions. Our experimental results demonstrate that ReLM improves the performance of state-of-the-art GNN-based methods across various chemical reaction datasets, especially in out-of-distribution settings. Codes are available at https://github.com/syr-cn/ReLM.
arxiv情報
| 著者 | Yaorui Shi,An Zhang,Enzhi Zhang,Zhiyuan Liu,Xiang Wang | 
| 発行日 | 2023-10-20 15:33:23+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
