C2RUST-BENCH: A Minimized, Representative Dataset for C-to-Rust Transpilation Evaluation

要約

過去20年にわたる脆弱性検出の努力にもかかわらず、記憶の安全性の脆弱性は引き続き重大な問題です。
最近のレポートでは、重要な解決策はメモリセーフ言語に移行することであることが示唆されています。
この目的のために、Cから有効輸送が一般的になり、Cプログラムのメモリ安全性の問題を解決します。
最近の作品は、Cから有効化された輸送フレームワークを提案しています。
ただし、包括的な評価データセットがありません。
1つの解決策は、十分な大きさのデータセットをまとめることですが、これにより、自動化されたフレームワークと、場合によっては手動の努力の分析時間が増加します。
この作業では、大きなセットから関数を選択して、最小化されているが代表的なデータセットを構築して、Cから引き抜きを評価する方法を構築します。
実際のプログラムの15,503関数から選択された2,905機能を含む2,905機能を含むC2RUSTベンチを提案します。

要約(オリジナル)

Despite the effort in vulnerability detection over the last two decades, memory safety vulnerabilities continue to be a critical problem. Recent reports suggest that the key solution is to migrate to memory-safe languages. To this end, C-to-Rust transpilation becomes popular to resolve memory-safety issues in C programs. Recent works propose C-to-Rust transpilation frameworks; however, a comprehensive evaluation dataset is missing. Although one solution is to put together a large enough dataset, this increases the analysis time in automated frameworks as well as in manual efforts for some cases. In this work, we build a method to select functions from a large set to construct a minimized yet representative dataset to evaluate the C-to-Rust transpilation. We propose C2RUST-BENCH that contains 2,905 functions, which are representative of C-to-Rust transpilation, selected from 15,503 functions of real-world programs.

arxiv情報

著者 Melih Sirlanci,Carter Yagemann,Zhiqiang Lin
発行日 2025-04-21 14:48:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.PL パーマリンク