Predictive Chemistry Augmented with Text Retrieval

要約

この論文は、化学分野における予測モデルを強化するための自然言語記述の使用に焦点を当てています。
従来、ケモインフォマティクス モデルは、文献から手動で抽出された広範な構造化データを使用してトレーニングされていました。
この論文では、文献から取得したテキストを使用して予測化学を直接強化する新しい方法である TextReact を紹介します。
TextReact は、特定の化学反応に関連するテキストの説明を取得し、それらを反応の分子表現と一致させます。
この調整は、予測子のトレーニングに組み込まれた補助のマスクされた LM 対物レンズによって強化されます。
私たちは、反応条件の推奨とワンステップ逆合成という 2 つの化学タスクに関するフレームワークを経験的に検証します。
TextReact は、テキスト検索を活用することで、分子データのみでトレーニングされた最先端のケモインフォマティクス モデルを大幅に上回ります。

要約(オリジナル)

This paper focuses on using natural language descriptions to enhance predictive models in the chemistry field. Conventionally, chemoinformatics models are trained with extensive structured data manually extracted from the literature. In this paper, we introduce TextReact, a novel method that directly augments predictive chemistry with texts retrieved from the literature. TextReact retrieves text descriptions relevant for a given chemical reaction, and then aligns them with the molecular representation of the reaction. This alignment is enhanced via an auxiliary masked LM objective incorporated in the predictor training. We empirically validate the framework on two chemistry tasks: reaction condition recommendation and one-step retrosynthesis. By leveraging text retrieval, TextReact significantly outperforms state-of-the-art chemoinformatics models trained solely on molecular data.

arxiv情報

著者 Yujie Qian,Zhening Li,Zhengkai Tu,Connor W. Coley,Regina Barzilay
発行日 2023-12-08 07:40:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR パーマリンク