CASS: Nvidia to AMD Transpilation with Data, Models, and Benchmark

要約

クロスアーキテクチャGPUコードトランスピレーションの最初の大規模データセットおよびモデルスイートである\ texttt {cass}を紹介し、ソースレベル(cuda〜 $ \ leftrightarrow $〜hip)とアセンブリレベル(nvidia sass〜 $ \ leftrightarrow $〜amd rdna3)の両方を標的とします。
データセットは、ホストとデバイス全体の70K検証済みのコードペアで構成され、低レベルのGPUコードポータビリティの重大なギャップに対処します。
このリソースを活用して、ドメイン固有の言語モデルの\ texttt {cass}ファミリーをトレーニングし、95 \%のソース翻訳精度と37.5%のアセンブリ翻訳精度を達成し、GPT-4o、Claude、Hipifyなどの商用ベースラインを大幅に上回ります。
生成されたコードは、テストケースの85%以上でネイティブパフォーマンスと一致し、ランタイムとメモリの動作を維持します。
厳密な評価をサポートするために、\ texttt {cass-bench}を紹介します。これは、グラウンドトゥルース実行を備えた16 GPUドメインにまたがるキュレーションされたベンチマークです。
すべてのデータ、モデル、および評価ツールは、GPUコンパイラツーリング、バイナリ互換性、LLM誘導ハードウェア翻訳の進捗を促進するためのオープンソースとしてリリースされます。
データセットとベンチマークは\ href {https://huggingface.co/datasets/mbzuai/cass} {\ textcolor {blue} {huggingface}}、コード付きです
\ href {https://github.com/gustavostahl/cass} {\ textcolor {blue} {github}}。

要約(オリジナル)

We introduce \texttt{CASS}, the first large-scale dataset and model suite for cross-architecture GPU code transpilation, targeting both source-level (CUDA~$\leftrightarrow$~HIP) and assembly-level (Nvidia SASS~$\leftrightarrow$~AMD RDNA3) translation. The dataset comprises 70k verified code pairs across host and device, addressing a critical gap in low-level GPU code portability. Leveraging this resource, we train the \texttt{CASS} family of domain-specific language models, achieving 95\% source translation accuracy and 37.5\% assembly translation accuracy, substantially outperforming commercial baselines such as GPT-4o, Claude, and Hipify. Our generated code matches native performance in over 85\% of test cases, preserving runtime and memory behavior. To support rigorous evaluation, we introduce \texttt{CASS-Bench}, a curated benchmark spanning 16 GPU domains with ground-truth execution. All data, models, and evaluation tools are released as open source to foster progress in GPU compiler tooling, binary compatibility, and LLM-guided hardware translation. Dataset and benchmark are on \href{https://huggingface.co/datasets/MBZUAI/cass}{\textcolor{blue}{HuggingFace}}, with code at \href{https://github.com/GustavoStahl/CASS}{\textcolor{blue}{GitHub}}.

arxiv情報

著者 Ahmed Heakl,Sarim Hashmi,Gustavo Bertolo Stahl,Seung Hun Eddie Han,Salman Khan,Abdulrahman Mahmoud
発行日 2025-05-22 17:48:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.AR, cs.CL, cs.LG, cs.PL パーマリンク