Interactive Molecular Discovery with Natural Language

要約

自然言語は、大規模な言語モデルの時代におけるさまざまな人間と機械の相互作用の重要な媒体となることが期待されています。
生化学分野においては、分子をめぐる一連の作業(物性予測、分子マイニングなど)は技術的敷居が高いものの、非常に重要です。
自然言語と化学言語の分子表現を橋渡しすることで、解釈可能性が大幅に向上し、これらのタスクの操作の難易度が軽減されるだけでなく、相補的な材料に散在する化学知識を融合して分子をより深く理解できるようになります。
これらの利点に基づいて、我々は、標的分子の記述と編集に自然言語を採用する新しいタスクである会話型分子設計を提案します。
このタスクをより適切に達成するために、実験的特性情報、分子空間知識、および自然言語と化学言語間の関連性を注入することによって強化された、知識が豊富で多用途の事前トレーニング済み生成モデルである ChatMol を設計します。
大規模言語モデル (ChatGPT など) を含むいくつかの典型的なソリューションが評価され、会話型分子設計の課題と知識強化手法の有効性が証明されています。
分子発見における自然言語相互作用のさらなる探求のための方向性を提供するために、事例の観察と分析が行われます。

要約(オリジナル)

Natural language is expected to be a key medium for various human-machine interactions in the era of large language models. When it comes to the biochemistry field, a series of tasks around molecules (e.g., property prediction, molecule mining, etc.) are of great significance while having a high technical threshold. Bridging the molecule expressions in natural language and chemical language can not only hugely improve the interpretability and reduce the operation difficulty of these tasks, but also fuse the chemical knowledge scattered in complementary materials for a deeper comprehension of molecules. Based on these benefits, we propose the conversational molecular design, a novel task adopting natural language for describing and editing target molecules. To better accomplish this task, we design ChatMol, a knowledgeable and versatile generative pre-trained model, enhanced by injecting experimental property information, molecular spatial knowledge, and the associations between natural and chemical languages into it. Several typical solutions including large language models (e.g., ChatGPT) are evaluated, proving the challenge of conversational molecular design and the effectiveness of our knowledge enhancement method. Case observations and analysis are conducted to provide directions for further exploration of natural-language interaction in molecular discovery.

arxiv情報

著者 Zheni Zeng,Bangchen Yin,Shipeng Wang,Jiarui Liu,Cheng Yang,Haishen Yao,Xingzhi Sun,Maosong Sun,Guotong Xie,Zhiyuan Liu
発行日 2023-06-21 02:05:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, physics.chem-ph, q-bio.BM パーマリンク