要約
カバレッジ制御は、先験的に知られていない対象の特徴や現象を共同で監視するためにロボットの群れをナビゲートする問題です。
この問題は、通信機能やセンシング機能が限られたロボットを使用する分散型環境では困難です。
我々は、この問題に対して学習可能な知覚-行動-通信 (LPAC) アーキテクチャを提案します。このアーキテクチャでは、畳み込みニューラル ネットワーク (CNN) が局所的な知覚を処理します。
グラフ ニューラル ネットワーク (GNN) はロボットの通信を容易にします。
最後に、浅い多層パーセプトロン (MLP) がロボットの動作を計算します。
GNN は、近くのロボットとどのような情報を通信するか、また受信した情報をどのように組み込むかを計算することで、ロボット群内でのコラボレーションを可能にします。
評価の結果、模倣学習を使用してトレーニングされた LPAC モデルは、標準的な分散型および集中型のカバレッジ制御アルゴリズムよりも優れたパフォーマンスを発揮することが示されています。
学習されたポリシーは、トレーニング データセットとは異なる環境に一般化され、より多くのロボットを備えた大規模な環境に転送され、ノイズの多い位置推定に対して堅牢です。
この結果は、LPAC アーキテクチャがロボットの群れにおける分散型ナビゲーションに適しており、協調動作を実現できることを示しています。
要約(オリジナル)
Coverage control is the problem of navigating a robot swarm to collaboratively monitor features or a phenomenon of interest not known a priori. The problem is challenging in decentralized settings with robots that have limited communication and sensing capabilities. We propose a learnable Perception-Action-Communication (LPAC) architecture for the problem, wherein a convolution neural network (CNN) processes localized perception; a graph neural network (GNN) facilitates robot communications; finally, a shallow multi-layer perceptron (MLP) computes robot actions. The GNN enables collaboration in the robot swarm by computing what information to communicate with nearby robots and how to incorporate received information. Evaluations show that the LPAC models — trained using imitation learning — outperform standard decentralized and centralized coverage control algorithms. The learned policy generalizes to environments different from the training dataset, transfers to larger environments with more robots, and is robust to noisy position estimates. The results indicate the suitability of LPAC architectures for decentralized navigation in robot swarms to achieve collaborative behavior.
arxiv情報
著者 | Saurav Agarwal,Ramya Muthukrishnan,Walker Gosrich,Vijay Kumar,Alejandro Ribeiro |
発行日 | 2024-02-08 16:05:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google