要約
保守可能で一般的なソフトウェアにより、開発者は堅牢なアプリケーションを効率的に構築できますが、これらの品質を達成するには、多くの場合、特殊なソリューションを再利用可能なコンポーネントにリファクタリングする必要があります。
この課題は、コードエージェントが孤立したプログラミングの問題を解決する際にますます正確になるため、特に関連性があります。
成長と再利用性をサポートする方法でコードをリファクタリングするコードエージェントの能力を調査します。
リファクタリングの方法とベンチマークの両方を提示します。司書、再利用可能なライブラリを生成するためのサンプルと再ランクの方法、およびコードエージェントが複数の独立したソリューションを最小化し、共同ライブラリにリファクタリングする必要があるベンチマークです。
最先端のコードエージェントと比較して、司書はミニコードでの圧縮と正確性の両方で強い結果を達成し、コーディングエージェントよりも1.6〜2倍の圧縮率を得て、正確性を改善します。
https://code-refactor.github.io/でコードとベンチマークをオープンソーシングします。
要約(オリジナル)
Maintainable and general software allows developers to build robust applications efficiently, yet achieving these qualities often requires refactoring specialized solutions into reusable components. This challenge becomes particularly relevant as code agents become increasingly accurate at solving isolated programming problems. We investigate code agents’ capacity to refactor code in ways supporting growth and reusability. We present both a method and a benchmark for refactoring: Librarian, a sample-and-rerank method for generating reusable libraries, and Minicode, a benchmark where code agents must minimize and refactor multiple independent solutions into a joint library. Compared to state-of-the-art code agents, Librarian achieves strong results on both compression and correctness on Minicode, obtaining compression rates 1.6-2x better than coding agents while also improving correctness. We open-source our code and benchmark at https://code-refactor.github.io/.
arxiv情報
著者 | Ziga Kovacic,Celine Lee,Justin Chiu,Wenting Zhao,Kevin Ellis |
発行日 | 2025-06-18 16:35:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google