要約
生成拡散モデル(GDM)は近年、将来のワイヤレスネットワークにおいて非常に効率的なセマンティック通信を可能にする、知覚品質の高いマルチメディア信号の合成において大きな成功を示している。本論文では、事前に訓練された拡散モデルを利用した、意図を考慮した生成的セマンティックマルチキャスティングフレームワークを開発する。すなわち、各ユーザはセマンティッククラスのサブセットのみの詳細に興味があると仮定する。送信機は次に、各ユーザーにその意図するクラスのみを送信し、他のクラス、すなわち非意図するクラスを事前に訓練された拡散モデルを利用してローカルに合成することを可能にする高度に圧縮されたセマンティック・マップを、共有された無線リソースを介して全ユーザーにマルチキャストする。これにより、各ユーザーで取得された信号は、受信したセマンティック・マップを利用して部分的に再構成され、部分的に合成される。これにより、非意図的クラスのプライバシーをより良く保持しつつ、無線リソースの利用を改善する。我々は、複数の受信機で信号を取得する際の総遅延を最小化するために、送信電力や圧縮率などの通信パラメータをクラス毎に適応させるための通信/計算を考慮した方式を、一般的なチャネル条件やユーザの再構成/合成歪み/知覚要件に合わせて設計する。シミュレーションの結果、ユーザで取得される信号の高い知覚品質を維持しながら、非生成および意図非認識のマルチキャスティングベンチマークと比較して、ユーザごとの待ち時間が大幅に短縮されることが実証された。
要約(オリジナル)
Generative diffusion models (GDMs) have recently shown great success in synthesizing multimedia signals with high perceptual quality enabling highly efficient semantic communications in future wireless networks. In this paper, we develop an intent-aware generative semantic multicasting framework utilizing pre-trained diffusion models. In the proposed framework, the transmitter decomposes the source signal to multiple semantic classes based on the multi-user intent, i.e. each user is assumed to be interested in details of only a subset of the semantic classes. The transmitter then sends to each user only its intended classes, and multicasts a highly compressed semantic map to all users over shared wireless resources that allows them to locally synthesize the other classes, i.e. non-intended classes, utilizing pre-trained diffusion models. The signal retrieved at each user is thereby partially reconstructed and partially synthesized utilizing the received semantic map. This improves utilization of the wireless resources, with better preserving privacy of the non-intended classes. We design a communication/computation-aware scheme for per-class adaptation of the communication parameters, such as the transmission power and compression rate to minimize the total latency of retrieving signals at multiple receivers, tailored to the prevailing channel conditions as well as the users reconstruction/synthesis distortion/perception requirements. The simulation results demonstrate significantly reduced per-user latency compared with non-generative and intent-unaware multicasting benchmarks while maintaining high perceptual quality of the signals retrieved at the users.
arxiv情報
著者 | Xinkai Liu,Mahdi Boloursaz Mashhadi,Li Qiao,Yi Ma,Rahim Tafazolli,Mehdi Bennis |
発行日 | 2024-11-04 17:58:54+00:00 |
arxivサイト | arxiv_id(pdf) |