要約
言語モデル、特にトランスフォーマーベースのアーキテクチャの成功は他の領域にも少しずつ浸透し、小分子、タンパク質、ポリマー上で動作する「科学言語モデル」が誕生しました。
化学では、初期段階の創薬における有望な最近の発見によって証明されるように、言語モデルは分子発見サイクルの加速に貢献します。
ここでは、分子発見における言語モデルの役割をレビューし、新規創薬、特性予測、反応化学における言語モデルの強みを強調します。
私たちは、科学言語モデリングの分野への参入障壁を下げる、貴重なオープンソース ソフトウェア資産に焦点を当てます。
最後に、チャットボット インターフェイスと計算化学ツールへのアクセスを組み合わせた将来の分子設計のビジョンをスケッチします。
私たちの貢献は、化学発見を加速するために言語モデルがどのように使用できるか、またどのように使用されるかを理解することに関心のある研究者、化学者、AI 愛好家にとって貴重なリソースとして役立ちます。
要約(オリジナル)
The success of language models, especially transformer-based architectures, has trickled into other domains giving rise to ‘scientific language models’ that operate on small molecules, proteins or polymers. In chemistry, language models contribute to accelerating the molecule discovery cycle as evidenced by promising recent findings in early-stage drug discovery. Here, we review the role of language models in molecular discovery, underlining their strength in de novo drug design, property prediction and reaction chemistry. We highlight valuable open-source software assets thus lowering the entry barrier to the field of scientific language modeling. Last, we sketch a vision for future molecular design that combines a chatbot interface with access to computational chemistry tools. Our contribution serves as a valuable resource for researchers, chemists, and AI enthusiasts interested in understanding how language models can and will be used to accelerate chemical discovery.
arxiv情報
著者 | Nikita Janakarajan,Tim Erdmann,Sarath Swaminathan,Teodoro Laino,Jannis Born |
発行日 | 2023-09-28 08:19:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google