The Impact of Large Language Models on Scientific Discovery: a Preliminary Study using GPT-4

要約

近年、自然言語処理における画期的な進歩は、強力な大規模言語モデル (LLM) の出現で最高潮に達しました。LLM は、自然言語の理解、生成、翻訳、
言語処理を超えたタスク。
このレポートでは、最先端の言語モデルである GPT-4 に焦点を当て、科学的発見の文脈における LLM のパフォーマンスを詳しく掘り下げます。
私たちの研究は、創薬、生物学、計算化学 (密度汎関数理論 (DFT) および分子動力学 (MD))、材料設計、偏微分方程式 (PDE) を含む、幅広い科学分野に及びます。
科学的タスクに関する GPT-4 の評価は、さまざまな研究領域にわたるその可能性を明らかにし、その領域固有の専門知識を検証し、科学の進歩を加速し、リソース配分を最適化し、将来のモデル開発を導き、学際的な研究を促進するために極めて重要です。
当社の調査方法論は主に、複雑な科学的概念と関係のモデルの理解を定性的に洞察する専門家主導のケース評価と、明確に定義されたドメイン固有の問題を解決するモデルの能力を定量的に評価するベンチマーク テストで構成されます。
私たちの予備調査では、GPT-4 がさまざまな科学的応用に有望な可能性を示し、複雑な問題解決や知識統合のタスクを処理する適性を示していることがわかりました。
大きく分けて、GPT-4の知識ベース、科学的理解、科学的数値計算能力、各種科学的予測能力を評価します。

要約(オリジナル)

In recent years, groundbreaking advancements in natural language processing have culminated in the emergence of powerful large language models (LLMs), which have showcased remarkable capabilities across a vast array of domains, including the understanding, generation, and translation of natural language, and even tasks that extend beyond language processing. In this report, we delve into the performance of LLMs within the context of scientific discovery, focusing on GPT-4, the state-of-the-art language model. Our investigation spans a diverse range of scientific areas encompassing drug discovery, biology, computational chemistry (density functional theory (DFT) and molecular dynamics (MD)), materials design, and partial differential equations (PDE). Evaluating GPT-4 on scientific tasks is crucial for uncovering its potential across various research domains, validating its domain-specific expertise, accelerating scientific progress, optimizing resource allocation, guiding future model development, and fostering interdisciplinary research. Our exploration methodology primarily consists of expert-driven case assessments, which offer qualitative insights into the model’s comprehension of intricate scientific concepts and relationships, and occasionally benchmark testing, which quantitatively evaluates the model’s capacity to solve well-defined domain-specific problems. Our preliminary exploration indicates that GPT-4 exhibits promising potential for a variety of scientific applications, demonstrating its aptitude for handling complex problem-solving and knowledge integration tasks. Broadly speaking, we evaluate GPT-4’s knowledge base, scientific understanding, scientific numerical calculation abilities, and various scientific prediction capabilities.

arxiv情報

著者 Microsoft Research AI4Science,Microsoft Azure Quantum
発行日 2023-11-13 14:26:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク