Converting Epics/Stories into Pseudocode using Transformers

要約

ユーザーのエピックやストーリーを擬似コードやコードでの適切な表現に変換するのは時間のかかる作業であり、産業プロジェクトでは時間の大部分を占める可能性があります。
この研究論文では、産業プロジェクトに費やす全体的な時間を短縮するために、小さな機能の特定のアジャイル ユーザー ストーリーから疑似コードを生成する方法論を提示することを目的としています。
擬似コードは、コンピュータ プログラムに含まれるステップをプログラミング言語に依存せずに表現したもので、任意のプログラミング言語に簡単に変換できます。
私たちは、自然言語処理の可能性を活用して、ソフトウェア開発のアジャイル モデルを使用する組織の開発プロセスを簡素化したいと考えています。
英語で記述された問題を擬似コードに変換する方法論を紹介します。
この方法論では、テキストから擬似コードへの変換タスクを 2 つのステージまたはサブタスクに分割し、それぞれが個別の機械翻訳タスクのように扱われます。
ステージ 1 はテキストからコードへの変換、ステージ 2 はコードから擬似コードへの変換です。
上記の 2 つのサブタスクで個別にトレーニングした場合、CodeT5 モデルが BLEU スコアの点で最良の結果を与えることがわかりました。
BLEU スコアは、機械翻訳されたテキストと一連の参照翻訳の間の類似性を測定するために使用される指標です。

要約(オリジナル)

The conversion of user epics or stories into their appropriate representation in pseudocode or code is a time-consuming task, which can take up a large portion of the time in an industrial project. With this research paper, we aim to present a methodology to generate pseudocode from a given agile user story of small functionalities so as to reduce the overall time spent on the industrial project. Pseudocode is a programming language agnostic representation of the steps involved in a computer program, which can be easily converted into any programming language. Leveraging the potential of Natural Language Processing, we want to simplify the development process in organizations that use the Agile Model of Software Development. We present a methodology to convert a problem described in the English language into pseudocode. This methodology divides the Text to Pseudocode conversion task into two stages or subtasks, each of which is treated like an individual machine translation task. Stage 1 is Text to Code Conversion and Stage 2 is Code to Pseudocode Conversion. We find that the CodeT5 model gives the best results in terms of BLEU score when trained separately on the two subtasks mentioned above. BLEU score is a metric that is used to measure the similarity between a machine-translated text and a set of reference translations.

arxiv情報

著者 Gaurav Kolhatkar,Akshit Madan,Nidhi Kowtal,Satyajit Roy,Sheetal Sonawane
発行日 2023-12-08 14:01:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク