Removing the need for ground truth UWB data collection: self-supervised ranging error correction using deep reinforcement learning

要約

UWB テクノロジーを使用した屋内測位は、センチメートルレベルの精度の可能性があるため、関心を集めています。
ただし、マルチパスの影響と見通し外の状態により、アンカーとタグの間の測距エラーが発生します。
これらの測距エラーを軽減するための既存のアプローチは、大規模なラベル付きデータセットの収集に依存しているため、現実世界の展開には非現実的です。
この論文では、ラベル付きグラウンド トゥルース データを必要としない、新しい自己教師あり深層強化学習アプローチを提案します。
強化学習エージェントは、チャネル インパルス応答を状態として使用し、修正範囲と推定範囲の間の誤差を最小限に抑えるために修正を予測します。
エージェントは、軌道の予測可能性とフィルタリングおよび平滑化を組み合わせることによって生成される修正を繰り返し改善することで、自己監視型で学習します。
現実世界の UWB 測定の実験では、データ依存性と一般化可能性の制限の欠如を克服し、最先端の教師あり手法と同等のパフォーマンスを実証しました。
これにより、自己教師あり深層強化学習は、実用的でスケーラブルな UWB 測距エラー修正のための有望なソリューションとなります。

要約(オリジナル)

Indoor positioning using UWB technology has gained interest due to its centimeter-level accuracy potential. However, multipath effects and non-line-of-sight conditions cause ranging errors between anchors and tags. Existing approaches for mitigating these ranging errors rely on collecting large labeled datasets, making them impractical for real-world deployments. This paper proposes a novel self-supervised deep reinforcement learning approach that does not require labeled ground truth data. A reinforcement learning agent uses the channel impulse response as a state and predicts corrections to minimize the error between corrected and estimated ranges. The agent learns, self-supervised, by iteratively improving corrections that are generated by combining the predictability of trajectories with filtering and smoothening. Experiments on real-world UWB measurements demonstrate comparable performance to state-of-the-art supervised methods, overcoming data dependency and lack of generalizability limitations. This makes self-supervised deep reinforcement learning a promising solution for practical and scalable UWB-ranging error correction.

arxiv情報

著者 Dieter Coppens,Ben Van Herbruggen,Adnan Shahid,Eli De Poorter
発行日 2024-10-01 08:05:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP パーマリンク