要約
自動ログ分析は、ソフトウェア システムの効率的な運用と保守 (O&M) に不可欠であり、システムの動作に関する重要な洞察を提供します。
ただし、既存のアプローチでは、ほとんどの場合、タスク固有のログとラベルのペアを使用して、分離されたタスク (異常検出、ログ解析など) を実行するモデルをトレーニングするものとしてログ分析が扱われます。
これらのタスクベースのアプローチは、複雑なシナリオに一般化する際に柔軟性が低く、タスク固有のトレーニング データに依存し、複数のモデルをデプロイする際にコストが大幅にかかります。
この論文では、複数のタスクとドメインのログとラベルのペアを、命令と応答のペアの統一形式に変換する命令ベースのトレーニング アプローチを提案します。
私たちのトレーニング済みモデル LogLM は、複雑なユーザー指示に従い、さまざまなタスクにわたってより適切に一般化できるため、柔軟性が向上し、タスク固有のトレーニング データへの依存が軽減されます。
主要なログ分析タスクを単一のモデルに統合することで、私たちのアプローチはモデル展開の負担も軽減します。
実験的に、LogLM は 5 つのログ分析機能にわたって既存のアプローチよりも優れたパフォーマンスを発揮し、複雑な命令や目に見えないタスクに対して強力な一般化能力を示します。
要約(オリジナル)
Automatic log analysis is essential for the efficient Operation and Maintenance (O&M) of software systems, providing critical insights into system behaviors. However, existing approaches mostly treat log analysis as training a model to perform an isolated task ( e.g., anomaly detection, log parsing, etc.) using task-specific log-label pairs. These task-based approaches are inflexible in generalizing to complex scenarios, depend on task-specific training data, and cost significantly when deploying multiple models. In this paper, we propose an instruction-based training approach that transforms log-label pairs from multiple tasks and domains into a unified format of instruction-response pairs. Our trained model, LogLM, can follow complex user instructions and generalize better across different tasks, thereby increasing flexibility and reducing the dependence on task-specific training data. By integrating major log analysis tasks into a single model, our approach also relieves model deployment burden. Experimentally, LogLM outperforms existing approaches across five log analysis capabilities, and exhibits strong generalization abilities on complex instructions and unseen tasks.
arxiv情報
著者 | Yilun Liu,Yuhe Ji,Shimin Tao,Minggui He,Weibin Meng,Shenglin Zhang,Yongqian Sun,Yuming Xie,Boxing Chen,Hao Yang |
発行日 | 2025-01-09 09:24:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google