MOSS: Enabling Code-Driven Evolution and Context Management for AI Agents

要約

大規模言語モデル (LLM) を利用した AI エージェントの開発は、真のチューリング完全性と適応的でコード駆動型の進化を達成する上で大きな課題に直面しています。
現在のアプローチでは、ランタイム コンテキストとは独立してコードが生成されることが多く、LLM のメモリに大きく依存するため、非効率が生じ、適応性が制限されます。
サンドボックス環境で手動でプロトコルを開発すると、エージェントの自律的な適応性がさらに制約されます。
重要なのは、マルチターン インタラクション全体でコードとコンテキストの一貫性を実現し、各インタラクション内でローカル変数を確実に分離することは、未解決の問題のままです。
コード生成と動的コンテキスト管理システムを統合することで、これらの課題に対処する新しいフレームワークである MOSS (llM 指向オペレーティング システム シミュレーション) を紹介します。
MOSS は、ローカル変数の分離や実行時の整合性の保持など、対話全体で Python コンテキストを維持するメカニズムを使用することで、一貫性と適応性を確保します。
このフレームワークの中核では、制御反転 (IoC) コンテナをデコレータと組み合わせて採用し、最小限の知識の原則を強制することで、エージェントが具体的な実装ではなく抽象インターフェイスに集中できるようにします。
これにより、新しいツールとライブラリのシームレスな統合が促進され、ランタイム インスタンスの置換が可能になり、プロンプトの複雑さが軽減され、エージェントに「表示されているものがそのまま得られる」環境が提供されます。
一連のケース スタディを通じて、このフレームワークがエージェント開発の効率と機能をどのように強化できるかを示し、コードを通じて進化できるチューリング完全エージェントに移行する際のその利点を強調します。

要約(オリジナル)

Developing AI agents powered by large language models (LLMs) faces significant challenges in achieving true Turing completeness and adaptive, code-driven evolution. Current approaches often generate code independently of its runtime context, relying heavily on the LLM’s memory, which results in inefficiencies and limits adaptability. Manual protocol development in sandbox environments further constrains the agent’s autonomous adaptability. Crucially, achieving consistency in code and context across multi-turn interactions and ensuring isolation of local variables within each interaction remains an unsolved problem. We introduce MOSS (llM-oriented Operating System Simulation), a novel framework that addresses these challenges by integrating code generation with a dynamic context management system. MOSS ensures consistency and adaptability by using a mechanism that maintains the Python context across interactions, including isolation of local variables and preservation of runtime integrity. At its core, the framework employs an Inversion of Control (IoC) container in conjunction with decorators to enforce the least knowledge principle, allowing agents to focus on abstract interfaces rather than concrete implementations. This facilitates seamless integration of new tools and libraries, enables runtime instance replacement, and reduces prompt complexity, providing a ‘what you see is what you get’ environment for the agent. Through a series of case studies, we show how this framework can enhance the efficiency and capabilities of agent development and highlight its advantages in moving towards Turing-complete agents capable of evolving through code.

arxiv情報

著者 Ming Zhu,Yi Zhou
発行日 2024-09-24 14:30:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.SE パーマリンク