要約
近年、業界内の分散マイクロサービスアーキテクチャの広範な採用により、システムの可用性と堅牢性の向上の需要が大幅に増加しています。
エンタープライズレベルのマイクロサービスシステムの複雑なサービスの呼び出しパスと依存関係により、サービスの呼び出し中に迅速に異常を見つけることは困難であり、通常のシステム操作とメンテナンスに扱いにくい問題を引き起こします。
このホワイトペーパーでは、トレース、ログ、システム監視メトリックを含むマルチモーダルデータを備えたマイクロサービスシステムの根本原因分析のための因果関係の不均一なグラフベースのフレームワーク、つまり追跡を提案します。
具体的には、関連情報は代表的な埋め込みにエンコードされ、マルチモーダル呼び出しグラフによってさらにモデル化されます。
それに続いて、隣接するメトリックとログノードから渡される注意深い不均一なメッセージを使用して、各インスタンスノードで異常検出が実行されます。
最後に、チェイスは、因果関係の流れを表すハイペレッジを備えた構築されたハイパーグラフから学び、根本原因の局在を実行します。
別個の属性を持つ2つのパブリックマイクロサービスデータセットで提案されたフレームワークを評価し、最先端の方法と比較します。
結果は、Chaseが最高のカウンターパートに対してそれぞれ最大36.2%(A@1)および29.4%(割合@1)までの平均パフォーマンスゲインを達成することを示しています。
要約(オリジナル)
In recent years, the widespread adoption of distributed microservice architectures within the industry has significantly increased the demand for enhanced system availability and robustness. Due to the complex service invocation paths and dependencies in enterprise-level microservice systems, it is challenging to locate the anomalies promptly during service invocations, thus causing intractable issues for normal system operations and maintenance. In this paper, we propose a Causal Heterogeneous grAph baSed framEwork for root cause analysis, namely CHASE, for microservice systems with multimodal data, including traces, logs, and system monitoring metrics. Specifically, related information is encoded into representative embeddings and further modeled by a multimodal invocation graph. Following that, anomaly detection is performed on each instance node with attentive heterogeneous message passing from its adjacent metric and log nodes. Finally, CHASE learns from the constructed hypergraph with hyperedges representing the flow of causality and performs root cause localization. We evaluate the proposed framework on two public microservice datasets with distinct attributes and compare with the state-of-the-art methods. The results show that CHASE achieves the average performance gain up to 36.2%(A@1) and 29.4%(Percentage@1), respectively to its best counterpart.
arxiv情報
著者 | Ziming Zhao,Zhenwei Wang,Tiehua Zhang,Zhishu Shen,Hai Dong,Zhen Lei,Xingjun Ma,Gaowei Xu,Zhijun Ding,Yun Yang |
発行日 | 2025-04-22 16:41:30+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google