要約
テンプレート マイニングは、ログ分析をサポートするための基本的なタスクの 1 つであり、大規模な Web アプリケーションの診断とトラブルシューティングをサポートします。
このホワイト ペーパーでは、インタラクティブなログ分析をサポートするヒューマン イン ザ ループ テンプレート マイニング フレームワークを開発します。これは、実際の診断や Web アプリケーションのトラブルシューティングに非常に望ましいものですが、以前のテンプレート マイニング アルゴリズムではサポートされていません。
3 種類の軽量ユーザー フィードバックを策定し、それらに基づいて、3 つのアトミックなヒューマン イン ザ ループ テンプレート マイニング アルゴリズムを設計します。
提案されたアルゴリズムの出力が正しいことが証明される穏やかな条件を導き出します。
また、各アルゴリズムの計算の複雑さとクエリの複雑さの上限も導き出します。
提案されたアルゴリズムを組み合わせて、広く使用されている 16 のベンチマーク データセットを超える 5 つの代表的なアルゴリズムのテンプレート マイニング精度を向上させることにより、提案されたアルゴリズムの汎用性を示します。
要約(オリジナル)
Template mining is one of the foundational tasks to support log analysis, which supports the diagnosis and troubleshooting of large scale Web applications. This paper develops a human-in-the-loop template mining framework to support interactive log analysis, which is highly desirable in real-world diagnosis or troubleshooting of Web applications but yet previous template mining algorithms fails to support it. We formulate three types of light-weight user feedbacks and based on them we design three atomic human-in-the-loop template mining algorithms. We derive mild conditions under which the outputs of our proposed algorithms are provably correct. We also derive upper bounds on the computational complexity and query complexity of each algorithm. We demonstrate the versatility of our proposed algorithms by combining them to improve the template mining accuracy of five representative algorithms over sixteen widely used benchmark datasets.
arxiv情報
著者 | Liming Wang,Hong Xie,Ye Li,Jian Tan,John C. S. Lui |
発行日 | 2023-02-27 17:14:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google