A Machine Learning Approach Towards SKILL Code Autocompletion

要約

ムーアの法則により電子システムの複雑さが増し続ける中、EDA(Electronic Design Automation)は世界的な需要に応えるために進歩しなければならない。EDA技術の重要な例として、EDAソフトウェアのカスタマイズや拡張に使用されるスクリプト言語SKILLがあります。近年、トランスフォーマ・アーキテクチャを使用したコード生成モデルは、学術的な場面で目覚ましい成果を上げており、開発者の生産性を向上させるために商用開発者ツールでも使用されています。我々の知る限り、ハードウェア設計エンジニアの生産性を向上させるためにSKILLコード自動補完に変換器を適用したのは、本研究が初めてです。本研究では、SKILLコードを生成するための新しいデータ効率的な手法を提案し、実験的に検証する。具体的には、(i)ラベル付けされていないデータとラベル付けされたデータの両方を持つ高品質なSKILLデータセットを作成し、(ii)教師なし学習と教師あり学習を使用して、一般的なプログラミング言語コードで事前に訓練されたT5モデルをカスタムSKILLデータセット上で微調整する学習戦略、(iii)合成されたSKILLコードを評価するための新しい手法を提案する。提案手法により訓練されたモデルが、人間判定スコアとBLEUスコアの点でベースラインを上回ることを示す。直面した大きな課題は、SKILLコードを生成するための変換モデルの学習に使用できる利用可能なSKILLコードデータが極めて少ないことであった。私たちが検証した改善にもかかわらず、利用可能なデータセットが極めて少ないため、SKILLコードを確実に自動補完できるモデルを訓練するにはまだ不十分でした。この限界とその他の限界、およびこれらの限界に対処するための今後の作業について説明します。

要約(オリジナル)

As Moore’s Law continues to increase the complexity of electronic systems, Electronic Design Automation (EDA) must advance to meet global demand. An important example of an EDA technology is SKILL, a scripting language used to customize and extend EDA software. Recently, code generation models using the transformer architecture have achieved impressive results in academic settings and have even been used in commercial developer tools to improve developer productivity. To the best of our knowledge, this study is the first to apply transformers to SKILL code autocompletion towards improving the productivity of hardware design engineers. In this study, a novel, data-efficient methodology for generating SKILL code is proposed and experimentally validated. More specifically, we propose a novel methodology for (i) creating a high-quality SKILL dataset with both unlabeled and labeled data, (ii) a training strategy where T5 models pre-trained on general programming language code are fine-tuned on our custom SKILL dataset using unsupervised and supervised learning, and (iii) evaluating synthesized SKILL code. We show that models trained using the proposed methodology outperform baselines in terms of human-judgment score and BLEU score. A major challenge faced was the extremely small amount of available SKILL code data that can be used to train a transformer model to generate SKILL code. Despite our validated improvements, the extremely small dataset available to us was still not enough to train a model that can reliably autocomplete SKILL code. We discuss this and other limitations as well as future work that could address these limitations.

arxiv情報

著者 Enrique Dehaerne,Bappaditya Dey,Wannes Meert
発行日 2023-12-04 14:29:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.PL, cs.SE, I.2.2 パーマリンク