Doubly-Dynamic ISAC Precoding for Vehicular Networks: A Constrained Deep Reinforcement Learning (CDRL) Approach

要約

統合センシングおよび通信 (ISAC) テクノロジーは、車両ネットワークを実現するために不可欠です。
ただし、このシナリオの通信チャネルは時間とともに変化する特性を示し、潜在的なターゲットが急速に移動して二重動的現象を引き起こす可能性があります。
この性質により、リアルタイム プリコーダーの設計に課題が生じます。
最適化ベースのソリューションは広く研究されていますが、複雑で完全な事前情報に大きく依存しているため、ダブル ダイナミクスでは非現実的です。
この課題に対処するために、制約付き深層強化学習 (CDRL) を使用して、ISAC プリコーダー設計の動的な更新を容易にすることを提案します。
さらに、プライマリのデュアルディープ決定論的ポリシー勾配 (PD-DDPG) と Wolpertinger アーキテクチャは、複雑な制約と可変のユーザー数の下でアルゴリズムを効率的にトレーニングできるように調整されています。
提案されたスキームは、観測に基づいたダイナミクスに適応するだけでなく、環境情報を活用してパフォーマンスを向上させ、複雑さを軽減します。
既存の候補に対するその優位性は実験によって検証されています。

要約(オリジナル)

Integrated sensing and communication (ISAC) technology is essential for enabling the vehicular networks. However, the communication channel in this scenario exhibits time-varying characteristics, and the potential targets may move rapidly, creating a doubly-dynamic phenomenon. This nature poses a challenge for real-time precoder design. While optimization-based solutions are widely researched, they are complex and heavily rely on perfect prior information, which is impractical in double dynamics. To address this challenge, we propose using constrained deep reinforcement learning (CDRL) to facilitate dynamic updates to the ISAC precoder design. Additionally, the primal dual-deep deterministic policy gradient (PD-DDPG) and Wolpertinger architecture are tailored to efficiently train the algorithm under complex constraints and variable numbers of users. The proposed scheme not only adapts to the dynamics based on observations but also leverages environmental information to enhance performance and reduce complexity. Its superiority over existing candidates has been validated through experiments.

arxiv情報

著者 Zonghui Yang,Shijian Gao,Xiang Cheng
発行日 2024-08-05 14:46:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, eess.SP パーマリンク