MoniLog: An Automated Log-Based Anomaly Detection System for Cloud Computing Infrastructures


– 大規模システムに1つの異常は何百万人ものユーザーに影響を与えることがある。
– そのようなイベントをリアルタイムで検出することは、サービスの品質を維持するために不可欠である。
– ログは、ソフトウェア開発およびメンテナンスの中心的な部分であり、ランタイム時に詳細な情報を記録することである。
– このようなログデータは、ほとんどすべてのコンピュータシステムで普遍的に利用可能であり、開発者やシステムメンテナンス業者が異常なイベントを監視し、分析することができるようにする。
– クラウドコンピューティング企業や大規模なオンラインプラットフォームにとって、成長はスケーリングポテンシャルに関連している。
– 異常検知プロセスを自動化することは、モダンシステムで生成されるログの増加するボリュームに対する監視能力の拡張性を確保する有望な方法である。
– この論文では、大規模環境内でリアルタイムの異常を検出する分散アプローチであるMoniLogを紹介する。
– MoniLogは、マルチソースログストリーム内のシーケンシャルおよび定量的な異常を検出することを目的として設計されている。
– MoniLogの出力分類器は、管理者の行動から学習し、異常の重要度レベルをラベル付けおよび評価する。


Within today’s large-scale systems, one anomaly can impact millions of users. Detecting such events in real-time is essential to maintain the quality of services. It allows the monitoring team to prevent or diminish the impact of a failure. Logs are a core part of software development and maintenance, by recording detailed information at runtime. Such log data are universally available in nearly all computer systems. They enable developers as well as system maintainers to monitor and dissect anomalous events. For Cloud computing companies and large online platforms in general, growth is linked to the scaling potential. Automatizing the anomaly detection process is a promising way to ensure the scalability of monitoring capacities regarding the increasing volume of logs generated by modern systems. In this paper, we will introduce MoniLog, a distributed approach to detect real-time anomalies within large-scale environments. It aims to detect sequential and quantitative anomalies within a multi-source log stream. MoniLog is designed to structure a log stream and perform the monitoring of anomalous sequences. Its output classifier learns from the administrator’s actions to label and evaluate the criticality level of anomalies.


著者 Arthur Vervaet
発行日 2023-04-24 09:21:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.IR パーマリンク