要約
近い将来、AI ソフトウェア開発アシスタントがソフトウェア業界で重要な役割を果たすことが予想されます。
しかし、現在のソフトウェア開発アシスタントは信頼性が低い傾向があり、多くの場合、間違ったコード、安全でないコード、または低品質のコードを生成します。
私たちは、信頼できる AI ソフトウェア開発アシスタントを構築、トレーニング、使用するための総合的なアーキテクチャを導入することで、これらの問題の解決を目指しています。
アーキテクチャの中心には、現実世界のコーディング シナリオと複雑なソフトウェア アーキテクチャを表すデータセットでトレーニングされ、正確性を超えたコード品質基準に基づいて微調整された基礎的な LLM があります。
LLM は、高度な意味理解のためにグラフベースのコード表現を利用します。
最新の背景知識を提供し、アシスタントが適切な説明を提供できるようにするために、システムにナレッジ グラフを統合することを想定しています。
最後に、制約付きデコード用のモジュール式フレームワークにより、生成されたコードに対して特定の保証 (正確性やセキュリティなど) が確実に保持されます。
要約(オリジナル)
It is expected that in the near future, AI software development assistants will play an important role in the software industry. However, current software development assistants tend to be unreliable, often producing incorrect, unsafe, or low-quality code. We seek to resolve these issues by introducing a holistic architecture for constructing, training, and using trustworthy AI software development assistants. In the center of the architecture, there is a foundational LLM trained on datasets representative of real-world coding scenarios and complex software architectures, and fine-tuned on code quality criteria beyond correctness. The LLM will make use of graph-based code representations for advanced semantic comprehension. We envision a knowledge graph integrated into the system to provide up-to-date background knowledge and to enable the assistant to provide appropriate explanations. Finally, a modular framework for constrained decoding will ensure that certain guarantees (e.g., for correctness and security) hold for the generated code.
arxiv情報
著者 | Daniel Maninger,Krishna Narasimhan,Mira Mezini |
発行日 | 2023-12-14 16:59:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google