要約
この論文では、セマンティック コミュニケーション (SemCom) における生成人工知能 (GAI) のアプリケーションを掘り下げ、徹底的な研究を紹介します。
変分オートエンコーダ、敵対的生成ネットワーク、拡散モデルなど、古典的な GAI モデルによって実現される 3 つの人気のある SemCom システムが最初に紹介されます。
各システムについて、GAI モデルの基本概念、対応する SemCom アーキテクチャ、および最近の取り組みに関する関連文献レビューが説明されています。
次に、最先端の GAI テクノロジーである大規模言語モデル (LLM) を組み込むことにより、新しい生成型 SemCom システムが提案されます。
このシステムは、送信機と受信機の両方に 2 つの LLM ベースの AI エージェントを備えており、それぞれ強力な情報理解とコンテンツ再生機能を可能にする「頭脳」として機能します。
この革新的な設計により、受信機は、送信機によって伝えられたコード化された意味情報に基づいて、ビット ストリームを復元するのではなく、目的のコンテンツを直接生成できます。
したがって、コミュニケーションの考え方を「情報回復」から「情報再生」に転換し、生成型 SemCom の新時代の到来をもたらします。
ポイントツーポイントビデオ検索のケーススタディは、提案された生成型 SemCom システムの優位性を実証するために提示され、従来の通信システムと比較して通信オーバーヘッドが 99.98% 削減され、検索精度が 53% 向上したことを示しています。
さらに、生成型 SemCom の 4 つの典型的なアプリケーション シナリオについて説明し、その後、将来の調査が必要な 3 つの未解決の問題について説明します。
一言で言えば、このペーパーは SemCom に GAI を適用するための包括的なガイドラインを提供し、将来のワイヤレス ネットワークにおける生成型 SemCom の効率的な実装への道を開きます。
要約(オリジナル)
This paper delves into the applications of generative artificial intelligence (GAI) in semantic communication (SemCom) and presents a thorough study. Three popular SemCom systems enabled by classical GAI models are first introduced, including variational autoencoders, generative adversarial networks, and diffusion models. For each system, the fundamental concept of the GAI model, the corresponding SemCom architecture, and the associated literature review of recent efforts are elucidated. Then, a novel generative SemCom system is proposed by incorporating the cutting-edge GAI technology-large language models (LLMs). This system features two LLM-based AI agents at both the transmitter and receiver, serving as ‘brains’ to enable powerful information understanding and content regeneration capabilities, respectively. This innovative design allows the receiver to directly generate the desired content, instead of recovering the bit stream, based on the coded semantic information conveyed by the transmitter. Therefore, it shifts the communication mindset from ‘information recovery’ to ‘information regeneration’ and thus ushers in a new era of generative SemCom. A case study on point-to-point video retrieval is presented to demonstrate the superiority of the proposed generative SemCom system, showcasing a 99.98% reduction in communication overhead and a 53% improvement in retrieval accuracy compared to the traditional communication system. Furthermore, four typical application scenarios for generative SemCom are delineated, followed by a discussion of three open issues warranting future investigation. In a nutshell, this paper provides a holistic set of guidelines for applying GAI in SemCom, paving the way for the efficient implementation of generative SemCom in future wireless networks.
arxiv情報
| 著者 | Jinke Ren,Yaping Sun,Hongyang Du,Weiwen Yuan,Chongjie Wang,Xianda Wang,Yingbin Zhou,Ziwei Zhu,Fangxin Wang,Shuguang Cui |
| 発行日 | 2024-12-11 18:59:50+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google