OpenAGI: When LLM Meets Domain Experts

要約

人間の知能(HI)は、基本的なスキルを組み合わせて複雑なタスクを解決することに優れている。この能力は人工知能(AI)にとって不可欠であり、包括的なAIエージェントに組み込まれ、人工知能(AGI)に向けた複雑なタスク解決のためにエキスパートモデルを活用できるようにすべきである。大規模言語モデル(LLM)は有望な学習と推論能力を示し、複雑な問題に取り組むために外部のモデル、ツール、プラグイン、またはAPIを効果的に使用することができます。この研究では、マルチステップの実世界タスクを解決するために設計されたオープンソースのAGI研究開発プラットフォームであるOpenAGIを紹介する。具体的には、OpenAGIは、ベンチマークと評価のための標準的なベンチマークタスクと、創造的な問題解決のための、より拡張可能なモデル、ツール、プラグイン、またはAPIを含むオープンエンドタスクを統合する、二重戦略を使用しています。タスクは自然言語クエリとしてLLMに提示され、LLMが適切なモデルを選択して実行する。また、タスクの結果を用いてLLMのタスク解決能力を向上させるタスクフィードバックからの強化学習(RLTF)メカニズムを提案し、これにより自己改善型のAIフィードバックループを構築する。我々は、AGIが広範かつ多面的な研究課題であり、明確に定義された解決策がないことを認識しているが、人間の一般知能と専門知能の融合を反映することに着想を得て、LLMをドメイン固有の専門家モデルと統合することは、AGIに向けた有望なアプローチを提供する。我々は、OpenAGIプロジェクトのコード、データセット、ベンチマーク、評価方法、およびUIデモをオープンソース化し、AGIの発展へのコミュニティ参加を促進しています。https://github.com/agiresearch/OpenAGI。

要約(オリジナル)

Human Intelligence (HI) excels at combining basic skills to solve complex tasks. This capability is vital for Artificial Intelligence (AI) and should be embedded in comprehensive AI Agents, enabling them to harness expert models for complex task-solving towards Artificial General Intelligence (AGI). Large Language Models (LLMs) show promising learning and reasoning abilities, and can effectively use external models, tools, plugins, or APIs to tackle complex problems. In this work, we introduce OpenAGI, an open-source AGI research and development platform designed for solving multi-step, real-world tasks. Specifically, OpenAGI uses a dual strategy, integrating standard benchmark tasks for benchmarking and evaluation, and open-ended tasks including more expandable models, tools, plugins, or APIs for creative problem-solving. Tasks are presented as natural language queries to the LLM, which then selects and executes appropriate models. We also propose a Reinforcement Learning from Task Feedback (RLTF) mechanism that uses task results to improve the LLM’s task-solving ability, which creates a self-improving AI feedback loop. While we acknowledge that AGI is a broad and multifaceted research challenge with no singularly defined solution path, the integration of LLMs with domain-specific expert models, inspired by mirroring the blend of general and specialized intelligence in humans, offers a promising approach towards AGI. We are open-sourcing the OpenAGI project’s code, dataset, benchmarks, evaluation methods, and the UI demo to foster community involvement in AGI advancement: https://github.com/agiresearch/OpenAGI.

arxiv情報

著者 Yingqiang Ge,Wenyue Hua,Kai Mei,Jianchao Ji,Juntao Tan,Shuyuan Xu,Zelong Li,Yongfeng Zhang
発行日 2023-11-03 15:24:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク