要約
目的: 量子コンピューティングは、迅速かつ実用的なソリューションによって、さまざまな領域にわたる問題解決を変革することを約束します。
ソフトウェアの進化と保守において、量子機械学習 (QML) は、特にコード リポジトリからのバグのあるソフトウェア コミットの検出などの課題への対処において、ほとんど研究されていない領域です。
方法: この研究では、30,924 個のデータ インスタンスを含むさまざまなデータセット サイズを持つ 14 のオープンソース ソフトウェア プロジェクトにわたって、バグのあるソフトウェア コミットを検出するための量子サポート ベクトル分類子 (QSVC) の実際的な応用を調査します。
QML アルゴリズム PQSVC (Pegasos QSVC) と QSVC を従来のサポート ベクター分類器 (SVC) と比較します。
私たちの技術は、QSVC アルゴリズムで大規模なデータセットを小さなサブセットに分割することで対処します。
これらのモデルからの予測を組み合わせてテスト データセット全体を検出するための集計方法を提案および評価します。
また、テストアプローチ中の量子特徴マッピングの困難を克服するために、増分テスト方法論も導入します。
結果: この調査では、バグのあるソフトウェア コミットの検出における QSVC と PQSVC の有効性が示されています。
集約手法により、より小さなデータ サブセットからの予測がうまく結合され、テスト データセット全体の全体的な検出精度が向上します。
インクリメンタル テスト手法は、テスト プロセス中の量子特徴マッピングに関連する課題を効果的に管理します。
結論: 私たちは欠陥予測における QML アルゴリズムの進歩に貢献し、この分野におけるさらなる研究の可能性を明らかにしました。
短期アクティビティ フレーム (STAF) の特定のシナリオでは、ソフトウェア システムの初期開発段階、特に機械学習モデルをトレーニングするにはデータセット サイズが不十分な場合に、バグのあるソフトウェア コミットを早期に検出することが強調されています。
要約(オリジナル)
Purpose: Quantum computing promises to transform problem-solving across various domains with rapid and practical solutions. Within Software Evolution and Maintenance, Quantum Machine Learning (QML) remains mostly an underexplored domain, particularly in addressing challenges such as detecting buggy software commits from code repositories. Methods: In this study, we investigate the practical application of Quantum Support Vector Classifiers (QSVC) for detecting buggy software commits across 14 open-source software projects with diverse dataset sizes encompassing 30,924 data instances. We compare the QML algorithm PQSVC (Pegasos QSVC) and QSVC against the classical Support Vector Classifier (SVC). Our technique addresses large datasets in QSVC algorithms by dividing them into smaller subsets. We propose and evaluate an aggregation method to combine predictions from these models to detect the entire test dataset. We also introduce an incremental testing methodology to overcome the difficulties of quantum feature mapping during the testing approach. Results: The study shows the effectiveness of QSVC and PQSVC in detecting buggy software commits. The aggregation technique successfully combines predictions from smaller data subsets, enhancing the overall detection accuracy for the entire test dataset. The incremental testing methodology effectively manages the challenges associated with quantum feature mapping during the testing process. Conclusion: We contribute to the advancement of QML algorithms in defect prediction, unveiling the potential for further research in this domain. The specific scenario of the Short-Term Activity Frame (STAF) highlights the early detection of buggy software commits during the initial developmental phases of software systems, particularly when dataset sizes remain insufficient to train machine learning models.
arxiv情報
著者 | Md Nadim,Mohammad Hassan,Ashis Kumar Mandal,Chanchal K. Roy,Banani Roy,Kevin A. Schneider |
発行日 | 2025-01-08 18:53:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google