Learning Decentralized Flocking Controllers with Spatio-Temporal Graph Neural Network

要約

最近では、群ロボット工学における分散制御のためのグラフ ニューラル ネットワーク (GNN) の使用に関する一連の研究が進められています。
しかし、近隣諸国の状態のみに依存するだけでは、集中管理政策を模倣するには不十分であることが観察されています。
この制限に対処するために、先行研究では $L$ ホップ遅延状態を計算に組み込むことが提案されています。
このアプローチは有望である一方で、遠く離れた群れのメンバー間で合意が得られず、小さなクラスターが形成され、その結果、団結した群れ行動が失敗する可能性があります。
代わりに、私たちのアプローチは、空間的拡張と時間的拡張の両方を包含する STGNN と呼ばれる時空間 GNN を活用します。
空間的拡張では、遠くの近隣からの遅延状態が収集され、一方、時間的拡張では、直近の近隣からの以前の状態が組み込まれます。
両方の拡張からより広範かつ包括的な情報が収集されるため、より効果的で正確な予測が可能になります。
私たちはロボットの群れを制御するためのエキスパート アルゴリズムを開発し、模倣学習を使用してエキスパート アルゴリズムに基づいて分散 STGNN モデルをトレーニングします。
提案されている STGNN アプローチをさまざまな設定でシミュレーションし、グローバル エキスパート アルゴリズムをエミュレートする分散型能力を実証します。
さらに、Crazyflie ドローンのグループによる凝集、リーダーの追従、障害物の回避を実現するアプローチを実装しました。
STGNN のパフォーマンスは、凝集、リーダーの追跡、および障害物回避のタスクを達成するための効果的で信頼できるアプローチとしての可能性を強調しています。

要約(オリジナル)

Recently a line of researches has delved the use of graph neural networks (GNNs) for decentralized control in swarm robotics. However, it has been observed that relying solely on the states of immediate neighbors is insufficient to imitate a centralized control policy. To address this limitation, prior studies proposed incorporating $L$-hop delayed states into the computation. While this approach shows promise, it can lead to a lack of consensus among distant flock members and the formation of small clusters, consequently resulting in the failure of cohesive flocking behaviors. Instead, our approach leverages spatiotemporal GNN, named STGNN that encompasses both spatial and temporal expansions. The spatial expansion collects delayed states from distant neighbors, while the temporal expansion incorporates previous states from immediate neighbors. The broader and more comprehensive information gathered from both expansions results in more effective and accurate predictions. We develop an expert algorithm for controlling a swarm of robots and employ imitation learning to train our decentralized STGNN model based on the expert algorithm. We simulate the proposed STGNN approach in various settings, demonstrating its decentralized capacity to emulate the global expert algorithm. Further, we implemented our approach to achieve cohesive flocking, leader following and obstacle avoidance by a group of Crazyflie drones. The performance of STGNN underscores its potential as an effective and reliable approach for achieving cohesive flocking, leader following and obstacle avoidance tasks.

arxiv情報

著者 Siji Chen,Yanshen Sun,Peihan Li,Lifeng Zhou,Chang-Tien Lu
発行日 2023-09-29 17:50:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク