Leveraging Data Mining Algorithms to Recommend Source Code Changes

要約

タイトル:データマイニングアルゴリズムを活用したソースコード変更の推奨
要約:

– 近年、ソースコード変更を支援するための技術を開発するためにデータマイニングが用いられてきた。
– しかしながら、データマイニング技術が他のアルゴリズムやベースラインと比較された研究は非常に少数である。
– 本論文では、自動的にソースコード変更を推奨するために4つのデータマイニングアルゴリズムを提案する。
– 実験評価も行い、7つのオープンソースプロジェクトからソース変更履歴を抽出し、パフォーマンス(適合率、再現率、F-measure)および実行時間について4つのデータマイニングアルゴリズム(Apriori、FP-Growth、Eclat、Relim)を比較する。
– 実験の結果、Aprioriが大規模プロジェクトに適していること、Eclatが小規模プロジェクトに適していること、さらにFP-Growthが実行時間が効率的であることが示された。
– また、ソフトウェアプロジェクトの性質や特徴、特に変更履歴に起因する可能性が高いが、Aprioriが一部の頻繁パターンマイニングアルゴリズムで他のアルゴリズムを上回る結果が得られた場合でも、全てのプロジェクトで一貫していないことが示された。

要約(オリジナル)

Context: Recent research has used data mining to develop techniques that can guide developers through source code changes. To the best of our knowledge, very few studies have investigated data mining techniques and–or compared their results with other algorithms or a baseline. Objectives: This paper proposes an automatic method for recommending source code changes using four data mining algorithms. We not only use these algorithms to recommend source code changes, but we also conduct an empirical evaluation. Methods: Our investigation includes seven open-source projects from which we extracted source change history at the file level. We used four widely data mining algorithms \ie{} Apriori, FP-Growth, Eclat, and Relim to compare the algorithms in terms of performance (Precision, Recall and F-measure) and execution time. Results: Our findings provide empirical evidence that while some Frequent Pattern Mining algorithms, such as Apriori may outperform other algorithms in some cases, the results are not consistent throughout all the software projects, which is more likely due to the nature and characteristics of the studied projects, in particular their change history. Conclusion: Apriori seems appropriate for large-scale projects, whereas Eclat appears to be suitable for small-scale projects. Moreover, FP-Growth seems an efficient approach in terms of execution time.

arxiv情報

著者 AmirHossein Naghshzan,Saeed Khalilazar,Pierre Poilane,Olga Baysal,Latifa Guerrouj,Foutse Khomh
発行日 2023-04-29 18:38:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG, cs.SE パーマリンク