AI for IT Operations (AIOps) on Cloud Platforms: Reviews, Opportunities and Challenges

要約

【タイトル】クラウドプラットフォームにおけるAIによるITオペレーション(AIOps):レビュー、機会、課題

【要約】
– AIOpsは、主にクラウドインフラストラクチャで生成されるITオペレーションプロセスのビッグデータとAIの力を組み合わせて、可用性を最大化するための実行可能な洞察力を提供することを目的としています。
– AI機能が運用効率を向上させるために活用できる多数の問題や、複数のユースケースがあります。
– 本論文では、AI技術に特に焦点を当て、AIOpsのビジョン、トレンド、課題、および機会についてレビューを提供しています。
– ITオペレーション活動によって発生する主要なデータのタイプ、その分析の規模と課題、および役立つ場所について詳しく説明します。
– AIOpsの主要なタスクを、インシデント検出、故障予測、原因分析、自動化アクションに分類し、それぞれの問題の定式化について説明し、それらを解決するための技術の分類を示します。
– AI文献の進歩が大きく役立つであろう比較的未開拓のトピックを特定し、この分野のトレンドと主要な投資機会について洞察を提供します。

要約(オリジナル)

Artificial Intelligence for IT operations (AIOps) aims to combine the power of AI with the big data generated by IT Operations processes, particularly in cloud infrastructures, to provide actionable insights with the primary goal of maximizing availability. There are a wide variety of problems to address, and multiple use-cases, where AI capabilities can be leveraged to enhance operational efficiency. Here we provide a review of the AIOps vision, trends challenges and opportunities, specifically focusing on the underlying AI techniques. We discuss in depth the key types of data emitted by IT Operations activities, the scale and challenges in analyzing them, and where they can be helpful. We categorize the key AIOps tasks as – incident detection, failure prediction, root cause analysis and automated actions. We discuss the problem formulation for each task, and then present a taxonomy of techniques to solve these problems. We also identify relatively under explored topics, especially those that could significantly benefit from advances in AI literature. We also provide insights into the trends in this field, and what are the key investment opportunities.

arxiv情報

著者 Qian Cheng,Doyen Sahoo,Amrita Saha,Wenzhuo Yang,Chenghao Liu,Gerald Woo,Manpreet Singh,Silvio Saverese,Steven C. H. Hoi
発行日 2023-04-10 15:38:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.DC, cs.LG, cs.SE パーマリンク