要約
無線アクセス ネットワーク (RAN) の状況は、従来の通信中心のインフラストラクチャから、コンピューティングと通信の統合プラットフォームへの変革的な変化を遂げています。
この記事では、RAN と人工知能 (AI) の両方のワークロードを同じインフラストラクチャ上に統合する AI-RAN について紹介します。
これにより、AI-RAN は将来のネットワークのパフォーマンス要求を満たすだけでなく、資産の利用率も向上します。
まず、RAN がモバイル ブロードバンドを超えて AI-RAN に向けてどのように進化したかを調査し、AI-RAN の表現を AI-for-RAN、AI-on-RAN、AI-and-RAN の 3 つの形式に明確にすることから始めます。
次に、AI-RAN における通信とコンピューティングの統合のための主要な要件と実現要因を特定します。
次に、AI-RAN を概念から実践に進めるためのリファレンス アーキテクチャを提供します。
AI-RAN の実用的な可能性を説明するために、NVIDIA Grace-Hopper GH200 サーバーを利用して RAN と AI のワークロードを同時に処理する概念実証を紹介します。
最後に、AI-RAN のさらなる開発を導く今後の作業の方向性を概説して記事を締めくくります。
要約(オリジナル)
The radio access network (RAN) landscape is undergoing a transformative shift from traditional, communication-centric infrastructures towards converged compute-communication platforms. This article introduces AI-RAN which integrates both RAN and artificial intelligence (AI) workloads on the same infrastructure. By doing so, AI-RAN not only meets the performance demands of future networks but also improves asset utilization. We begin by examining how RANs have evolved beyond mobile broadband towards AI-RAN and articulating manifestations of AI-RAN into three forms: AI-for-RAN, AI-on-RAN, and AI-and-RAN. Next, we identify the key requirements and enablers for the convergence of communication and computing in AI-RAN. We then provide a reference architecture for advancing AI-RAN from concept to practice. To illustrate the practical potential of AI-RAN, we present a proof-of-concept that concurrently processes RAN and AI workloads utilizing NVIDIA Grace-Hopper GH200 servers. Finally, we conclude the article by outlining future work directions to guide further developments of AI-RAN.
arxiv情報
著者 | Lopamudra Kundu,Xingqin Lin,Rajesh Gadiyar,Jean-Francois Lacasse,Shuvo Chowdhury |
発行日 | 2025-01-15 18:47:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google