L2MAC: Large Language Model Automatic Computer for Extensive Code Generation

要約

トランスフォーマーベースの大規模言語モデル (LLM) は、基礎となるトランスフォーマー アーキテクチャの固定コンテキスト ウィンドウによって制約され、長く一貫した出力を生成する能力が妨げられます。
メモリ拡張 LLM は有望なソリューションですが、現在のアプローチでは、(1) メモリの読み取りのみに焦点を当て、その展開を新しいメモリの連結に減らすか、(2) メモリ拡張に適応できない非常に特殊なメモリを使用するため、長時間の出力生成タスクを処理できません。
他のドメイン。
この論文では、長時間一貫した出力生成を実現する、LLM ベースのマルチエージェント システムである、初の実用的な LLM ベースの汎用ストアド プログラム自動コンピュータ (ノイマン アーキテクチャ) フレームワークである L2MAC について説明します。
そのメモリには 2 つのコンポーネントがあります。1 つはユーザーが指定したタスクを解決するためのプロンプト プログラムが格納される命令レジストリ、もう 1 つは最終出力と中間出力を含むファイル ストアです。
各命令は、個別の LLM エージェントによって実行され、そのコンテキストは、ファイル ストアとの効果的な対話を確保するために正確なメモリの読み取りおよび書き込みが可能な制御ユニットによって管理されます。
これらのコンポーネントにより、L2MAC は広範な出力を生成できるようになり、有限コンテキスト ウィンドウの制約をバイパスしながら、ユーザーが指定した複雑なタスクを満たす出力を生成できます。
私たちは、L2MAC がシステム設計タスク用の大規模なコードベースの生成において最先端のパフォーマンスを実現し、詳細なユーザー指定タスクの実装において他のコーディング手法を大幅に上回ることを経験的に実証しています。
L2MAC が、本全体を書くなどの汎用の広範なテキストベースのタスクに機能することを示します。
また、既存の方法と比較した L2MAC のパフォーマンス向上に関する貴重な洞察を提供します。

要約(オリジナル)

Transformer-based large language models (LLMs) are constrained by the fixed context window of the underlying transformer architecture, hindering their ability to produce long and coherent outputs. Memory-augmented LLMs are a promising solution, but current approaches cannot handle long output generation tasks since they (1) only focus on reading memory and reduce its evolution to the concatenation of new memories or (2) use very specialized memories that cannot adapt to other domains. This paper presents L2MAC, the first practical LLM-based general-purpose stored-program automatic computer (von Neumann architecture) framework, an LLM-based multi-agent system, for long and consistent output generation. Its memory has two components: the instruction registry, which is populated with a prompt program to solve the user-given task, and a file store, which will contain the final and intermediate outputs. Each instruction in turn is executed by a separate LLM agent, whose context is managed by a control unit capable of precise memory reading and writing to ensure effective interaction with the file store. These components enable L2MAC to generate extensive outputs, bypassing the constraints of the finite context window while producing outputs that fulfill a complex user-specified task. We empirically demonstrate that L2MAC achieves state-of-the-art performance in generating large codebases for system design tasks, significantly outperforming other coding methods in implementing the detailed user-specified task; we show that L2MAC works for general-purpose extensive text-based tasks, such as writing an entire book; and we provide valuable insights into L2MAC’s performance improvement over existing methods.

arxiv情報

著者 Samuel Holt,Max Ruiz Luyten,Mihaela van der Schaar
発行日 2024-04-10 13:38:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.PL, cs.SE, D.2.3 パーマリンク