要約
この論文では、不確実なトポロジカル ネットワークにおけるマルチロボットの信頼性の高いナビゲーション問題を研究します。この問題は、道路網の不確実性に直面してロボット チームの時間通り到着確率を最大化することを目的としています。
これらのネットワークの不確実性は、未知のエッジの通過可能性に起因しており、ロボットがエッジの開始ノードに到着したときにのみそれが明らかになります。
既存のアプローチは、リアルタイムのネットワーク トポロジの変化に適応するのに苦労することが多く、変化するトポロジ環境には適していません。
この課題に対処するために、私たちは問題を部分的に観察可能なマルコフ決定プロセス (POMDP) フレームワークに再定式化し、ナビゲーション タスクの進化する性質を捉える動的適応グラフ埋め込み手法を導入します。
深層強化学習とグラフ アテンション ネットワーク (GAT) を統合することで、各ロボットのポリシー学習プロセスをさらに強化し、自己注意を活用して重要なグラフ機能に焦点を当てます。
提案されたアプローチ、つまり学習を伴う可変環境におけるマルチエージェント ルーティング (MARVEL) は、一般化されたポリシー勾配アルゴリズムを採用して、ロボットのリアルタイム意思決定プロセスを繰り返し最適化します。
私たちは、MARVEL のパフォーマンスを、最先端の信頼性の高いナビゲーション アルゴリズムと、さまざまな正規の交通ネットワークにおけるカナダの旅行者の問題解決策と比較し、不確実なトポロジー ネットワークにおける適応性とパフォーマンスの向上を実証します。
さらに、トポロジ構造が不確実な自作の屋内環境内を移動する 2 台のロボットによる現実世界の実験により、MARVEL の実用性が実証されました。
要約(オリジナル)
This paper studies the multi-robot reliable navigation problem in uncertain topological networks, which aims at maximizing the robot team’s on-time arrival probabilities in the face of road network uncertainties. The uncertainty in these networks stems from the unknown edge traversability, which is only revealed to the robot upon its arrival at the edge’s starting node. Existing approaches often struggle to adapt to real-time network topology changes, making them unsuitable for varying topological environments. To address the challenge, we reformulate the problem into a Partially Observable Markov Decision Process (POMDP) framework and introduce the Dynamic Adaptive Graph Embedding method to capture the evolving nature of the navigation task. We further enhance each robot’s policy learning process by integrating deep reinforcement learning with Graph Attention Networks (GATs), leveraging self-attention to focus on critical graph features. The proposed approach, namely Multi-Agent Routing in Variable Environments with Learning (MARVEL) employs the generalized policy gradient algorithm to optimize the robots’ real-time decision-making process iteratively. We compare the performance of MARVEL with state-of-the-art reliable navigation algorithms as well as Canadian traveller problem solutions in a range of canonical transportation networks, demonstrating improved adaptability and performance in uncertain topological networks. Additionally, real-world experiments with two robots navigating within a self-constructed indoor environment with uncertain topological structures demonstrate MARVEL’s practicality.
arxiv情報
著者 | Zhuoyuan Yu,Hongliang Guo,Albertus Hendrawan Adiwahono,Jianle Chan,Brina Shong Wey Tynn,Chee-Meng Chew,Wei-Yun Yau |
発行日 | 2024-11-25 06:48:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google