Vision Transformers for Efficient Indoor Pathloss Radio Map Prediction

要約

ビジョン トランスフォーマー (ViT) は、さまざまな画像ベースのタスクやその他のタスクにわたって最先端のパフォーマンスを達成することに目覚ましい成功を収めています。
この研究では、ViT ベースのニューラル ネットワークを使用して、屋内パスロス無線マップ予測の問題に対処します。
ネットワークの汎化能力は、目に見えない建物、周波数、さまざまな放射パターンを持つアンテナなど、さまざまな設定にわたって評価されます。
広範なデータ拡張技術と事前トレーニングされた DINOv2 重みを活用することで、最も困難なシナリオでも有望な結果を達成します。

要約(オリジナル)

Vision Transformers (ViTs) have demonstrated remarkable success in achieving state-of-the-art performance across various image-based tasks and beyond. In this study, we employ a ViT-based neural network to address the problem of indoor pathloss radio map prediction. The network’s generalization ability is evaluated across diverse settings, including unseen buildings, frequencies, and antennas with varying radiation patterns. By leveraging extensive data augmentation techniques and pretrained DINOv2 weights, we achieve promising results, even under the most challenging scenarios.

arxiv情報

著者 Edvard Ghukasyan,Hrant Khachatrian,Rafayel Mkrtchyan,Theofanis P. Raptis
発行日 2024-12-12 17:55:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.NI パーマリンク