Large Language Models in Plant Biology


ChatGPT などの大規模言語モデル (LLM) は世界を席巻しており、特定の形式のチューリング テストに合格しています。
ただし、LLM は人間の言語に限定されず、DNA、タンパク質、遺伝子発現などの連続データを分析します。
結果として得られる基礎モデルは、データ内の複雑なパターンを識別するために再利用でき、その結果、セルラー システムを説明できる強力な多目的予測ツールが得られます。
このレビューでは、さまざまな種類の LLM について概説し、生物学における LLM の最近の使用法を紹介します。
LLM はまだ植物界に受け入れられていないため、これらのモデルを植物界にどのように展開できるかについても説明します。


Large Language Models (LLMs), such as ChatGPT, have taken the world by storm and have passed certain forms of the Turing test. However, LLMs are not limited to human language and analyze sequential data, such as DNA, protein, and gene expression. The resulting foundation models can be repurposed to identify the complex patterns within the data, resulting in powerful, multi-purpose prediction tools able to explain cellular systems. This review outlines the different types of LLMs and showcases their recent uses in biology. Since LLMs have not yet been embraced by the plant community, we also cover how these models can be deployed for the plant kingdom.


著者 Hilbert Yuen In Lam,Xing Er Ong,Marek Mutwil
発行日 2024-01-05 12:59:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL, q-bio.GN パーマリンク