Communicative Agents for Software Development

要約

ソフトウェア エンジニアリングは、微妙な直感や相談に依存することが多い、複雑な意思決定プロセスを特徴とする分野です。
深層学習の最近の進歩により、ソフトウェア開発のさまざまな段階で実装される精緻な設計を通じて、ソフトウェア エンジニアリングの実践に革命が起こり始めています。
このペーパーでは、ソフトウェア開発プロセス全体を通して大規模言語モデル (LLM) を活用し、自然言語コミュニケーションを通じて主要なプロセスを合理化および統合することで、各フェーズでの特殊なモデルの必要性を排除する革新的なパラダイムを紹介します。
このパラダイムの中核となるのは、仮想チャットを利用したソフトウェア開発会社である ChatDev で、確立されたウォーターフォール モデルを反映しており、開発プロセスを設計、コーディング、テスト、文書化という 4 つの異なる時系列段階に細心の注意を払って分割しています。
各段階では、プログラマー、コードレビュー担当者、テストエンジニアなどの「ソフトウェアエージェント」のチームが関与し、協力的な対話を促進し、シームレスなワークフローを促進します。
チャット チェーンは進行役として機能し、各段階をアトミックなサブタスクに分割します。
これにより二重の役割が可能になり、コンテキストを認識したコミュニケーションを通じてソリューションの提案と検証が可能になり、特定のサブタスクの効率的な解決につながります。
ChatDev の機器分析は、ソフトウェア生成におけるその顕著な有効性を強調しており、1 ドル未満のコストで 7 分以内にソフトウェア開発プロセス全体を完了することができます。
潜在的な脆弱性を特定して軽減するだけでなく、優れた効率性と費用対効果を維持しながら、潜在的な幻覚も修正します。
ChatDev の可能性は、LLM をソフトウェア開発の領域に統合する新たな可能性を明らかにします。
私たちのコードは https://github.com/OpenBMB/ChatDev で入手できます。

要約(オリジナル)

Software engineering is a domain characterized by intricate decision-making processes, often relying on nuanced intuition and consultation. Recent advancements in deep learning have started to revolutionize software engineering practices through elaborate designs implemented at various stages of software development. In this paper, we present an innovative paradigm that leverages large language models (LLMs) throughout the entire software development process, streamlining and unifying key processes through natural language communication, thereby eliminating the need for specialized models at each phase. At the core of this paradigm lies ChatDev, a virtual chat-powered software development company that mirrors the established waterfall model, meticulously dividing the development process into four distinct chronological stages: designing, coding, testing, and documenting. Each stage engages a team of ‘software agents’, such as programmers, code reviewers, and test engineers, fostering collaborative dialogue and facilitating a seamless workflow. The chat chain acts as a facilitator, breaking down each stage into atomic subtasks. This enables dual roles, allowing for proposing and validating solutions through context-aware communication, leading to efficient resolution of specific subtasks. The instrumental analysis of ChatDev highlights its remarkable efficacy in software generation, enabling the completion of the entire software development process in under seven minutes at a cost of less than one dollar. It not only identifies and alleviates potential vulnerabilities but also rectifies potential hallucinations while maintaining commendable efficiency and cost-effectiveness. The potential of ChatDev unveils fresh possibilities for integrating LLMs into the realm of software development. Our code is available at https://github.com/OpenBMB/ChatDev.

arxiv情報

著者 Chen Qian,Xin Cong,Wei Liu,Cheng Yang,Weize Chen,Yusheng Su,Yufan Dang,Jiahao Li,Juyuan Xu,Dahai Li,Zhiyuan Liu,Maosong Sun
発行日 2023-12-19 12:56:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.MA, cs.SE パーマリンク