Leveraging Large Language Models for Code Translation and Software Development in Scientific Computing

要約

基礎モデルと生成人工知能 (GenAI) の出現により、科学技術コンピューティング、特にコード開発、リファクタリング、およびあるプログラミング言語から別のプログラミング言語への翻訳における生産性が変革されようとしています。
ただし、GenAI の出力が正しいことは保証できないため、手動による介入が依然として必要です。
この介入の一部は、正確性の検証と効果的な迅速な開発のための追加の方法論とともに、タスク固有のツールを通じて自動化できます。
私たちは、大型ハドロン衝突型加速器 (LHC) で粒子相互作用をシミュレートするために使用されるレガシー Fortran コードベース内のコード変換、言語の相互運用性、コードベース検査を支援する GenAI のアプリケーションを調査しました。
その過程で、迅速なエンジニアリングとユーザーの監視を組み合わせてコード変換の効率的なプロセスを確立するツール CodeScribe を開発しました。
このペーパーでは、CodeScribe が Fortran コードから C++ への変換を支援し、レガシー システムを最新の C++ ライブラリと統合するための Fortran-C API を生成し、コード構成とアルゴリズム実装に対する開発者サポートを提供する方法を示します。
また、AI 主導のコード変換の課題にも取り組み、科学計算ワークフローの生産性を向上させるその利点を強調します。

要約(オリジナル)

The emergence of foundational models and generative artificial intelligence (GenAI) is poised to transform productivity in scientific computing, especially in code development, refactoring, and translating from one programming language to another. However, because the output of GenAI cannot be guaranteed to be correct, manual intervention remains necessary. Some of this intervention can be automated through task-specific tools, alongside additional methodologies for correctness verification and effective prompt development. We explored the application of GenAI in assisting with code translation, language interoperability, and codebase inspection within a legacy Fortran codebase used to simulate particle interactions at the Large Hadron Collider (LHC). In the process, we developed a tool, CodeScribe, which combines prompt engineering with user supervision to establish an efficient process for code conversion. In this paper, we demonstrate how CodeScribe assists in converting Fortran code to C++, generating Fortran-C APIs for integrating legacy systems with modern C++ libraries, and providing developer support for code organization and algorithm implementation. We also address the challenges of AI-driven code translation and highlight its benefits for enhancing productivity in scientific computing workflows.

arxiv情報

著者 Akash Dhruv,Anshu Dubey
発行日 2024-10-31 16:48:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SE パーマリンク