要約
ミッションクリティカルなインフラストラクチャとしてのデータセンター(DCS)は、人工知能(AI)とデジタル経済の成長を促進する上で極めて重要です。
インターネットDCからAI DCへの進化により、ビジネスレジリエンスの改善と所有権の総コストの削減のために、データセンターの運営と管理に新しい課題が導入されました。
その結果、ベストプラクティスに基づいた従来のアプローチを超えて、将来のデータセンターのためには、新しいパラダイムが必要です。
この研究では、DCの運用と管理を進めるための新しい物理AI(Phyai)フレームワークを提案および開発します。
当社のシステムは、最先端の工業製品と社内の研究開発の新たな能力を活用しています。
具体的には、3つのコアモジュール、すなわち:1)非常に正確な方法でDC操作をシミュレートするための業界グレードの社内シミュレーションエンジンを提供します。
このシステムは、将来のデータセンターにリアルタイムのデジタルツインを有効にすることにより、将来のデータセンターの運用と管理をデジタル化、最適化、および自動化するためのスケーラブルで適応性のあるソリューションを提供します。
その有効性を説明するために、リアルタイムで大規模なDCの熱および空気流プロファイルを予測するための代理モデルの構築に関する説得力のあるケーススタディを提示します。
私たちの結果は、0.18 {\ deg}の絶対温度予測誤差の中央値で、従来の時間のかかる計算流体ダイナミクス/熱伝達(CFD/HT)シミュレーションよりも優れた性能を示しています。
この新たなアプローチは、将来のDC操作で物理的AIを進めるためのいくつかの潜在的な研究方向への扉を開くでしょう。
要約(オリジナル)
Data centers (DCs) as mission-critical infrastructures are pivotal in powering the growth of artificial intelligence (AI) and the digital economy. The evolution from Internet DC to AI DC has introduced new challenges in operating and managing data centers for improved business resilience and reduced total cost of ownership. As a result, new paradigms, beyond the traditional approaches based on best practices, must be in order for future data centers. In this research, we propose and develop a novel Physical AI (PhyAI) framework for advancing DC operations and management. Our system leverages the emerging capabilities of state-of-the-art industrial products and our in-house research and development. Specifically, it presents three core modules, namely: 1) an industry-grade in-house simulation engine to simulate DC operations in a highly accurate manner, 2) an AI engine built upon NVIDIA PhysicsNemo for the training and evaluation of physics-informed machine learning (PIML) models, and 3) a digital twin platform built upon NVIDIA Omniverse for our proposed 5-tier digital twin framework. This system presents a scalable and adaptable solution to digitalize, optimize, and automate future data center operations and management, by enabling real-time digital twins for future data centers. To illustrate its effectiveness, we present a compelling case study on building a surrogate model for predicting the thermal and airflow profiles of a large-scale DC in a real-time manner. Our results demonstrate its superior performance over traditional time-consuming Computational Fluid Dynamics/Heat Transfer (CFD/HT) simulation, with a median absolute temperature prediction error of 0.18 {\deg}C. This emerging approach would open doors to several potential research directions for advancing Physical AI in future DC operations.
arxiv情報
著者 | Zhiwei Cao,Minghao Li,Feng Lin,Jimin Jia,Yonggang Wen,Jianxiong Yin,Simon See |
発行日 | 2025-04-15 15:06:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google