要約
従来の生物医学研究は、科学文献やデータセットの急激な増加により、ますます労働集約的になっています。
人工知能 (AI)、特に大規模言語モデル (LLM) は、さまざまなステップを自動化することで、このプロセスに革命をもたらす可能性があります。
それでも、学際的な専門知識の必要性、実験計画の論理性、性能測定など、大きな課題が残っています。
この文書では、ドライラボ実験を含む生物医学研究プロセス全体を合理化するために設計された初のエンドツーエンド自動化システムである BioResearcher を紹介します。
BioResearcher はモジュール式マルチエージェント アーキテクチャを採用しており、検索、文献処理、実験計画、プログラミングに特化したエージェントを統合しています。
BioResearcher は、複雑なタスクを論理的に関連するサブタスクに分解し、階層的な学習アプローチを利用することで、学際的な要件と論理的な複雑さの課題に効果的に対処します。
さらに、BioResearcher には、プロセス内品質管理のための LLM ベースのレビュー担当者が組み込まれており、実験プロトコルの品質と自動化を評価するための新しい評価指標が導入されています。
BioResearcher は、これまで達成されていなかった 8 つの研究目標にわたって、平均実行成功率 63.07% を達成しました。
生成されたプロトコルは、5 つの品質指標において、一般的なエージェント システムよりも平均して 22.0% 優れています。
このシステムは、研究者の作業負荷を軽減し、生物医学的発見を加速する大きな可能性を示し、自動研究システムにおける将来の革新への道を切り開きます。
要約(オリジナル)
Conventional biomedical research is increasingly labor-intensive due to the exponential growth of scientific literature and datasets. Artificial intelligence (AI), particularly Large Language Models (LLMs), has the potential to revolutionize this process by automating various steps. Still, significant challenges remain, including the need for multidisciplinary expertise, logicality of experimental design, and performance measurements. This paper introduces BioResearcher, the first end-to-end automated system designed to streamline the entire biomedical research process involving dry lab experiments. BioResearcher employs a modular multi-agent architecture, integrating specialized agents for search, literature processing, experimental design, and programming. By decomposing complex tasks into logically related sub-tasks and utilizing a hierarchical learning approach, BioResearcher effectively addresses the challenges of multidisciplinary requirements and logical complexity. Furthermore, BioResearcher incorporates an LLM-based reviewer for in-process quality control and introduces novel evaluation metrics to assess the quality and automation of experimental protocols. BioResearcher successfully achieves an average execution success rate of 63.07% across eight previously unmet research objectives. The generated protocols averagely outperform typical agent systems by 22.0% on five quality metrics. The system demonstrates significant potential to reduce researchers’ workloads and accelerate biomedical discoveries, paving the way for future innovations in automated research systems.
arxiv情報
著者 | Yi Luo,Linghang Shi,Yihao Li,Aobo Zhuang,Yeyun Gong,Ling Liu,Lin Chen |
発行日 | 2024-12-12 16:35:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google