Log Summarisation for Defect Evolution Analysis

要約

ログの分析と監視は、ソフトウェアのメンテナンスと欠陥の特定において不可欠な要素です。
特に、ログ データの一時的な性質と膨大なサイズは、ログを長期にわたってどのように要約して監視できるかという、興味深く重要な研究課題につながります。
これはソフトウェア エンジニアリング コミュニティにおける研究の基本的なトピックですが、研究は通常、ヒューリスティック、構文、または静的ベースの手法に焦点を当ててきました。
この研究では、ログ クラスターを動的に更新してコード エラーのライフサイクルの監視を可能にする、エラー ログに対するオンライン セマンティック ベースのクラスタリング アプローチを提案します。
また、テンポラル ログ クラスターのパフォーマンスを評価するための新しいメトリックも導入します。
産業用データセットを使用してシステムと評価指標をテストしたところ、当社のソリューションが同様のシステムよりも優れていることがわかりました。
私たちの研究が欠陥データセットのさらなる時間的探索を促進することを願っています。

要約(オリジナル)

Log analysis and monitoring are essential aspects in software maintenance and identifying defects. In particular, the temporal nature and vast size of log data leads to an interesting and important research question: How can logs be summarised and monitored over time? While this has been a fundamental topic of research in the software engineering community, work has typically focused on heuristic-, syntax-, or static-based methods. In this work, we suggest an online semantic-based clustering approach to error logs that dynamically updates the log clusters to enable monitoring code error life-cycles. We also introduce a novel metric to evaluate the performance of temporal log clusters. We test our system and evaluation metric with an industrial dataset and find that our solution outperforms similar systems. We hope that our work encourages further temporal exploration in defect datasets.

arxiv情報

著者 Rares Dolga,Ran Zmigrod,Rui Silva,Salwa Alamir,Sameena Shah
発行日 2024-03-13 09:18:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SE パーマリンク