要約
大規模なソフトウェア開発の急速なペースにより、従来のテスト方法の需要が高まり、多くの場合、効率、精度、およびカバレッジのボトルネックにつながります。
バグの検出と、より少ないバグでのコーディングを、共通の目標を共有する2つの相互接続された問題として、リソースが限られていることを削減することにより、バグのコードを設定することにより、ソフトウェアテストに関する新しい視点を提案します。
コードの自動完了とチャットボット駆動のQ&AをサポートするAIアシストプログラミングに関する以前の作業をソフトウェアテストの領域に拡張します。
バグ検出をコードベースの更新と同期する自動テストシステムであるテスト用のCopilotを紹介し、コンテキストベースの検索拡張生成(RAG)を活用して、大規模な言語モデル(LLMS)の機能を強化します。
私たちの評価は、バグ検出精度の31.2%の改善、重要なテストカバレッジの12.6%の増加、および最新のソフトウェア開発プラクティスにおけるAI主導の技術の変革の可能性を強調している10.5%のユーザー受け入れ率を示しています。
要約(オリジナル)
The rapid pace of large-scale software development places increasing demands on traditional testing methodologies, often leading to bottlenecks in efficiency, accuracy, and coverage. We propose a novel perspective on software testing by positing bug detection and coding with fewer bugs as two interconnected problems that share a common goal, which is reducing bugs with limited resources. We extend our previous work on AI-assisted programming, which supports code auto-completion and chatbot-powered Q&A, to the realm of software testing. We introduce Copilot for Testing, an automated testing system that synchronizes bug detection with codebase updates, leveraging context-based Retrieval Augmented Generation (RAG) to enhance the capabilities of large language models (LLMs). Our evaluation demonstrates a 31.2% improvement in bug detection accuracy, a 12.6% increase in critical test coverage, and a 10.5% higher user acceptance rate, highlighting the transformative potential of AI-driven technologies in modern software development practices.
arxiv情報
著者 | Yuchen Wang,Shangxin Guo,Chee Wei Tan |
発行日 | 2025-04-02 16:20:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google