Automated Bug Report Prioritization in Large Open-Source Projects

要約

大規模なオープンソースプロジェクトには、ソフトウェアの欠陥(バグ)レポートやユーザーおよび開発者コミュニティからの新機能リクエストなど、多数の問題(バグと呼ばれます)が速いレートで受け取ります。
多くの場合、プロジェクトリソースが限られているため、すべての問題に対処することはできません。
代わりに、彼らはプロジェクトの優先事項と問題の重大度に従ってそれらを優先順位付けする必要があります。
この論文では、問題追跡システムのオープンバグリポジトリに保存されているバグレポートの自然言語テキストに基づいて、自動化されたバグの優先順位付けに対する新しいアプローチを提案します。
TopicMiner-MTMと呼ばれるLDAのバリアントを使用してトピックモデリングを実施し、BERT大手言語モデルを使用してテキスト分類を行い、最先端と比較してより高いパフォーマンスレベルを達成します。
Eclipseプラットフォームプロジェクトの85,156のバグレポートを含む既存の参照データセットを使用した実験結果は、バグレポートの優先予測の精度、精度、リコール、およびF1メジャーの観点から既存のアプローチを上回ることを示しています。

要約(オリジナル)

Large open-source projects receive a large number of issues (known as bugs), including software defect (i.e., bug) reports and new feature requests from their user and developer communities at a fast rate. The often limited project resources do not allow them to deal with all issues. Instead, they have to prioritize them according to the project’s priorities and the issues’ severities. In this paper, we propose a novel approach to automated bug prioritization based on the natural language text of the bug reports that are stored in the open bug repositories of the issue-tracking systems. We conduct topic modeling using a variant of LDA called TopicMiner-MTM and text classification with the BERT large language model to achieve a higher performance level compared to the state-of-the-art. Experimental results using an existing reference dataset containing 85,156 bug reports of the Eclipse Platform project indicate that we outperform existing approaches in terms of Accuracy, Precision, Recall, and F1-measure of the bug report priority prediction.

arxiv情報

著者 Riley Pierson,Armin Moin
発行日 2025-04-22 13:57:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SE パーマリンク