HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases

要約

大規模な言語モデル(LLMS)は、ハードウェア説明言語(HDL)の生成やデバッグなど、ハードウェア設計タスクの可能性を実証しています。
しかし、現実世界のリポジトリレベルのHDLプロジェクトでの彼らのパフォーマンスは、数千または数万のコードラインを含むプロジェクトを妨げています。
この目的のために、グラフ検索拡張生成(グラフRAG)をLLMSと統合する新しいフレームワークであるHDLXGraphを提案し、抽象的な構文ツリー(AST)とデータフローグラフ(DFG)を組み込んだHDL固有のグラフ表現を導入して、コードグラフビューとハードウェアグラフビューの両方をキャプチャします。
HDLXGraphは、構造情報を組み込むことにより、類似性に基づくセマンティック検索に固有の限られたリコール問題を軽減するだけでなく、タスク固有の回収によるさまざまな現実世界のタスクへの拡張性を高めるだけでなく、類似性に基づいたセマンティック検索に固有の限られたリコールの問題を軽減するだけでなく、デュアルレトリエバルメカニズムを利用します。
さらに、包括的なHDL検索ベンチマークの欠如に対処するために、実際のリポジトリレベルのプロジェクトから派生した多粒度評価データセットであるHDLSearchを紹介します。
実験結果は、HDLXGraphが、類似性ベースのRAGと比較して、それぞれ平均検索精度、デバッグ効率、完了品質を12.04%、12.22%、5.04%改善することを示しています。
hdlxgraphのコードと収集されたhdlsearchベンチマークは、https://github.com/nick-zheng-q/hdlxgraphで入手できます。

要約(オリジナル)

Large Language Models (LLMs) have demonstrated their potential in hardware design tasks, such as Hardware Description Language (HDL) generation and debugging. Yet, their performance in real-world, repository-level HDL projects with thousands or even tens of thousands of code lines is hindered. To this end, we propose HDLxGraph, a novel framework that integrates Graph Retrieval Augmented Generation (Graph RAG) with LLMs, introducing HDL-specific graph representations by incorporating Abstract Syntax Trees (ASTs) and Data Flow Graphs (DFGs) to capture both code graph view and hardware graph view. HDLxGraph utilizes a dual-retrieval mechanism that not only mitigates the limited recall issues inherent in similarity-based semantic retrieval by incorporating structural information, but also enhances its extensibility to various real-world tasks by a task-specific retrieval finetuning. Additionally, to address the lack of comprehensive HDL search benchmarks, we introduce HDLSearch, a multi-granularity evaluation dataset derived from real-world repository-level projects. Experimental results demonstrate that HDLxGraph significantly improves average search accuracy, debugging efficiency and completion quality by 12.04%, 12.22% and 5.04% compared to similarity-based RAG, respectively. The code of HDLxGraph and collected HDLSearch benchmark are available at https://github.com/Nick-Zheng-Q/HDLxGraph.

arxiv情報

著者 Pingqing Zheng,Jiayin Qin,Fuqi Zhang,Shang Wu,Yu Cao,Caiwen Ding,Yang,Zhao
発行日 2025-05-21 16:14:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AR, cs.CL, cs.LG パーマリンク