Doubly-Dynamic ISAC Precoding for Vehicular Networks: A Constrained Deep Reinforcement Learning (CDRL) Approach

要約

統合センシングおよび通信 (ISAC) テクノロジーは、車両ネットワークのサポートに不可欠です。
ただし、このシナリオの通信チャネルは時間変動を示し、潜在的なターゲットが急速に移動する可能性があり、その結果、二重のダイナミクスが発生します。
この性質により、リアルタイム プリコーダーの設計に課題が生じます。
最適化ベースのソリューションは広く研究されていますが、複雑で完全なチャネル関連情報に大きく依存しているため、ダブル ダイナミクスでは現実的ではありません。
この課題に対処するために、制約付き深層強化学習を使用して、ISAC プリコーダーの動的な更新を容易にすることを提案します。
さらに、プライマリのデュアルディープ決定論的ポリシー勾配と Wolpertinger アーキテクチャは、複雑な制約とさまざまなユーザー数の下でアルゴリズムを効率的にトレーニングできるように調整されています。
提案されたスキームは、観測に基づいたダイナミクスに適応するだけでなく、環境情報を活用してパフォーマンスを向上させ、複雑さを軽減します。
既存の候補に対するその優位性は実験によって検証されています。

要約(オリジナル)

Integrated sensing and communication (ISAC) technology is essential for supporting vehicular networks. However, the communication channel in this scenario exhibits time variations, and the potential targets may move rapidly, resulting in double dynamics. This nature poses a challenge for real-time precoder design. While optimization-based solutions are widely researched, they are complex and heavily rely on perfect channel-related information, which is impractical in double dynamics. To address this challenge, we propose using constrained deep reinforcement learning to facilitate dynamic updates to the ISAC precoder. Additionally, the primal dual-deep deterministic policy gradient and Wolpertinger architecture are tailored to efficiently train the algorithm under complex constraints and varying numbers of users. The proposed scheme not only adapts to the dynamics based on observations but also leverages environmental information to enhance performance and reduce complexity. Its superiority over existing candidates has been validated through experiments.

arxiv情報

著者 Zonghui Yang,Shijian Gao,Xiang Cheng
発行日 2024-08-23 15:31:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, eess.SP パーマリンク