LPAC: Learnable Perception-Action-Communication Loops with Applications to Coverage Control

要約

カバレッジ制御は、先験的に知られていない対象の特徴や現象を共同で監視するためにロボットの群れをナビゲートする問題です。
この問題は、通信機能やセンシング機能が限られたロボットを使用する分散型環境では困難です。
この論文では、カバレッジ制御問題に対する学習可能な知覚-アクション-コミュニケーション (LPAC) アーキテクチャを提案します。
提案されたソリューションでは、畳み込みニューラル ネットワーク (CNN) が環境の局所的な認識を処理します。
グラフ ニューラル ネットワーク (GNN) により、隣接するロボット間で関連情報の通信が可能になります。
最後に、浅い多層パーセプトロン (MLP) がロボットの動作を計算します。
通信モジュールの GNN は、近隣諸国とどのような情報を通信するか、また受信した情報をどのように使用して適切なアクションを実行するかを計算することで、ロボット群内でのコラボレーションを可能にします。
環境全体を認識する集中透視アルゴリズムを備えた模倣学習を使用してモデルをトレーニングします。
評価の結果、LPAC モデルは標準の分散型および集中型カバレッジ制御アルゴリズムよりも優れたパフォーマンスを発揮することが示されています。
学習されたポリシーは、トレーニング データセットとは異なる環境に一般化され、ロボットの数が増加した大規模な環境に転送され、ノイズの多い位置推定に対して堅牢です。
この結果は、LPAC アーキテクチャがロボットの群れにおける分散型ナビゲーションに適しており、協調的な動作を実現することを示しています。

要約(オリジナル)

Coverage control is the problem of navigating a robot swarm to collaboratively monitor features or a phenomenon of interest not known a priori. The problem is challenging in decentralized settings with robots that have limited communication and sensing capabilities. This paper proposes a learnable Perception-Action-Communication (LPAC) architecture for the coverage control problem. In the proposed solution, a convolution neural network (CNN) processes localized perception of the environment; a graph neural network (GNN) enables communication of relevant information between neighboring robots; finally, a shallow multi-layer perceptron (MLP) computes robot actions. The GNN in the communication module enables collaboration in the robot swarm by computing what information to communicate with neighbors and how to use received information to take appropriate actions. We train models using imitation learning with a centralized clairvoyant algorithm that is aware of the entire environment. Evaluations show that the LPAC models outperform standard decentralized and centralized coverage control algorithms. The learned policy generalizes to environments different from the training dataset, transfers to larger environments with an increased number of robots, and is robust to noisy position estimates. The results indicate that LPAC architectures are well-suited for decentralized navigation in robot swarms to achieve collaborative behavior.

arxiv情報

著者 Saurav Agarwal,Ramya Muthukrishnan,Walker Gosrich,Alejandro Ribeiro,Vijay Kumar
発行日 2024-01-10 00:08:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク