要約
生命と生物多様性の貯蔵庫である海洋を掘り下げる海洋科学は、地球表面の70%以上を海洋が占めていることを考えると、大きな意義がある。近年、大規模言語モデル(LLM)の進歩により、科学のパラダイムが大きく変わりつつある。他の領域での成功にもかかわらず、現在のLLMは海洋学者のような領域専門家のニーズに応えるには不十分であることが多く、海洋科学におけるLLMの可能性は十分に検討されていない。その本質的な理由は、海洋データの膨大で複雑な性質と、知識におけるより高い粒度と豊かさの必要性にある。このような問題を解決するために、海洋科学の様々なタスクに精通した海洋領域初の大規模言語モデルであるOceanGPTを紹介する。また、海洋領域における大量の命令データを自動的に取得するための新しいフレームワークであるOceanGPTを提案し、マルチエージェントの連携に基づいて命令を生成する。さらに、海洋領域におけるLLMの能力を評価するために、初の海洋学ベンチマークであるOceanBenchを構築する。包括的な実験にもかかわらず、OceanGPTは海洋科学タスクに対してより高いレベルの知識専門性を示すだけでなく、海洋技術における予備的な具現化知能能力も獲得している。
要約(オリジナル)
Ocean science, which delves into the oceans that are reservoirs of life and biodiversity, is of great significance given that oceans cover over 70% of our planet’s surface. Recently, advances in Large Language Models (LLMs) have transformed the paradigm in science. Despite the success in other domains, current LLMs often fall short in catering to the needs of domain experts like oceanographers, and the potential of LLMs for ocean science is under-explored. The intrinsic reasons are the immense and intricate nature of ocean data as well as the necessity for higher granularity and richness in knowledge. To alleviate these issues, we introduce OceanGPT, the first-ever large language model in the ocean domain, which is expert in various ocean science tasks. We also propose OceanGPT, a novel framework to automatically obtain a large volume of ocean domain instruction data, which generates instructions based on multi-agent collaboration. Additionally, we construct the first oceanography benchmark, OceanBench, to evaluate the capabilities of LLMs in the ocean domain. Though comprehensive experiments, OceanGPT not only shows a higher level of knowledge expertise for oceans science tasks but also gains preliminary embodied intelligence capabilities in ocean technology.
arxiv情報
著者 | Zhen Bi,Ningyu Zhang,Yida Xue,Yixin Ou,Daxiong Ji,Guozhou Zheng,Huajun Chen |
発行日 | 2024-09-03 10:19:52+00:00 |
arxivサイト | arxiv_id(pdf) |