要約
人間の知能は、基本的なスキルを組み合わせて複雑なタスクを解決することに優れている。この能力は人工知能(AI)にとって不可欠であり、包括的な知的モデルに組み込まれ、人工一般知能(AGI)に向けた複雑なタスク解決のためにエキスパートモデルを活用できるようにすべきである。大規模言語モデル(LLM)は有望な学習と推論能力を示し、複雑な問題に取り組むために外部のモデル、ツール、APIを効果的に利用することができる。この研究では、マルチステップの実世界タスク用に設計されたオープンソースのAGI研究プラットフォームであるOpenAGIを紹介する。具体的には、OpenAGIは、ベンチマークと評価のための標準的なベンチマークタスクと、創造的な問題解決のための、より拡張可能なモデル、ツール、またはAPIを含むオープンエンドタスクを統合する、二重戦略を使用しています。タスクは自然言語クエリとしてLLMに提示され、LLMが適切なモデルを選択して実行します。また、タスクの結果を用いてLLMの能力を向上させるタスクフィードバックからの強化学習(RLTF)メカニズムを提案し、これにより自己改善型のAIフィードバックループを構築する。我々は、AGIが広範かつ多面的な研究課題であり、唯一無二の解決策が存在しないことを認識しているが、人間の一般知能と専門知能の融合を反映することから着想を得た、LLMと領域固有の専門家モデルの統合は、AGIに向けた有望なアプローチを提供する。私たちは、OpenAGIプロジェクトのコード、データセット、ベンチマーク、評価方法、デモをオープンソース化し、AGIの発展へのコミュニティ参加を促進しています。https://github.com/agiresearch/OpenAGI。
要約(オリジナル)
Human intelligence excels at combining basic skills to solve complex tasks. This capability is vital for Artificial Intelligence (AI) and should be embedded in comprehensive intelligent models, enabling them to harness expert models for complex task-solving towards Artificial General Intelligence (AGI). Large Language Models (LLMs) show promising learning and reasoning abilities, and can effectively use external models, tools or APIs to tackle complex problems. In this work, we introduce OpenAGI, an open-source AGI research platform designed for multi-step, real-world tasks. Specifically, OpenAGI uses a dual strategy, integrating standard benchmark tasks for benchmarking and evaluation, and open-ended tasks including more expandable models, tools or APIs for creative problem-solving. Tasks are presented as natural language queries to the LLM, which then selects and executes appropriate models. We also propose a Reinforcement Learning from Task Feedback (RLTF) mechanism that uses task results to improve the LLM’s ability, which creates a self-improving AI feedback loop. While we acknowledge that AGI is a broad and multifaceted research challenge with no singularly defined solution path, the integration of LLMs with domain-specific expert models, inspired by mirroring the blend of general and specialized intelligence in humans, offers a promising approach towards AGI. We are open-sourcing the OpenAGI project’s code, dataset, benchmarks, evaluation methods, and demo to foster community involvement in AGI advancement: https://github.com/agiresearch/OpenAGI.
arxiv情報
著者 | Yingqiang Ge,Wenyue Hua,Kai Mei,Jianchao Ji,Juntao Tan,Shuyuan Xu,Zelong Li,Yongfeng Zhang |
発行日 | 2023-08-02 19:00:53+00:00 |
arxivサイト | arxiv_id(pdf) |