AI-Driven Resource Allocation Framework for Microservices in Hybrid Cloud Platforms

要約

ハイブリッド・クラウド環境におけるスケーラブルで効率的なリソース管理に対する要求の高まりから、動的なリソース割り当てのためのAI駆動型アプローチの探求が始まっている。本稿では、ハイブリッドクラウドプラットフォームにおけるマイクロサービス間のリソース割り当てのためのAI駆動型フレームワークを紹介する。このフレームワークは、強化学習(RL)ベースのリソース利用最適化を採用し、コストの削減とパフォーマンスの向上を実現する。このフレームワークは、AIモデルとクラウド管理ツールを統合し、動的なスケーリングとコスト効率の高い低遅延サービス提供の課題に対応する。強化学習モデルは、マイクロサービスの要求に応じてプロビジョニングされたリソースを継続的に調整し、将来の消費傾向を予測して、リソースの過小プロビジョニングと過剰プロビジョニングの両方を最小限に抑えます。予備的なシミュレーション結果では、コストに関連するリソースの提供にAIを使用することで、手動プロビジョニングや閾値ベースの自動スケーリングアプローチと比較して、支出を最大30~40%削減できることが示されている。また、リソースの利用効率は20%~30%向上し、それに伴いピーク需要期における待ち時間も15%~20%短縮されると見積もられている。本研究では、AI主導のアプローチを既存の静的およびルールベースのリソース割り当て手法と比較し、この新しいモデルが柔軟性とリアルタイム性の点でそれらを上回る能力を持つことを実証した。その結果、強化学習がハイブリッドクラウドプラットフォームの最適化をさらに改善し、マイクロサービスベースのアプリケーションのコスト効率とスケーリング力を25~35%改善できることが示された。提案されたフレームワークは、ダイナミックでパフォーマンスクリティカルな環境におけるクラウドリソース管理のための強力でスケーラブルなソリューションである。

要約(オリジナル)

The increasing demand for scalable, efficient resource management in hybrid cloud environments has led to the exploration of AI-driven approaches for dynamic resource allocation. This paper presents an AI-driven framework for resource allocation among microservices in hybrid cloud platforms. The framework employs reinforcement learning (RL)-based resource utilization optimization to reduce costs and improve performance. The framework integrates AI models with cloud management tools to respond to challenges of dynamic scaling and cost-efficient low-latency service delivery. The reinforcement learning model continuously adjusts provisioned resources as required by the microservices and predicts the future consumption trends to minimize both under- and over-provisioning of resources. Preliminary simulation results indicate that using AI in the provision of resources related to costs can reduce expenditure by up to 30-40% compared to manual provisioning and threshold-based auto-scaling approaches. It is also estimated that the efficiency in resource utilization is expected to improve by 20%-30% with a corresponding latency cut of 15%-20% during the peak demand periods. This study compares the AI-driven approach with existing static and rule-based resource allocation methods, demonstrating the capability of this new model to outperform them in terms of flexibility and real-time interests. The results indicate that reinforcement learning can make optimization of hybrid cloud platforms even better, offering a 25-35% improvement in cost efficiency and the power of scaling for microservice-based applications. The proposed framework is a strong and scalable solution to managing cloud resources in dynamic and performance-critical environments.

arxiv情報

著者 Biman Barua,M. Shamim Kaiser
発行日 2024-12-03 17:41:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CE, cs.PF, cs.SE, cs.SY, eess.SY パーマリンク