要約
大規模なマルチエージェント システム (MAS) の分散型でスケーラブルかつ安全な制御は、困難な問題です。
この論文では、障害物のある大規模な環境において、多数のエージェントがローカル情報のみを使用して安全を維持し、目的地に到達する必要がある環境において、安全なマルチエージェント制御のための分散フレームワークを設計します。
グラフ コントロール バリア ファンクション (GCBF) と呼ばれる新しいクラスの証明書を導入します。これは、安全性を保証するための確立されたコントロール バリア ファンクション (CBF) 理論に基づいており、MAS のスケーラブルかつ一般化可能な分散制御にグラフ構造を利用しています。
我々は、単一の GCBF を備えた任意サイズの MAS の安全性を証明するための新しい理論的枠組みを開発しました。
我々は、グラフニューラルネットワーク(GNN)を使用して候補GCBFと分散制御ポリシーをパラメータ化する新しいトレーニングフレームワークGCBF+を提案します。
提案されたフレームワークは分散型であり、実世界のロボット アプリケーション向けに、実際の状態情報の代わりに LiDAR から点群を直接取得することができます。
位置の交換から移動目標への衝突なしのドッキングまで、さまざまな目的を持ったドローンの群れでのさまざまなハードウェア実験を通じて、提案された方法の有効性を説明します。
さらに、エージェントの数と密度、障害物の数を増加させる広範な数値実験を実行します。
実験結果によると、非線形エージェント (Crazyflie ドローンなど) を使用する複雑な環境では、GCBF+ が手作りの CBF ベースの手法よりも優れており、最大 256 エージェントの比較的小規模な MAS と優れた強化学習 (
RL) メソッドは、1024 エージェントを使用した MAS で最大 40% 削減されました。
さらに、提案された方法は、RL ベースの方法では一般的なトレードオフである、高い安全率を達成するための目標達成の観点からパフォーマンスを犠牲にしません。
要約(オリジナル)
Distributed, scalable, and safe control of large-scale multi-agent systems (MAS) is a challenging problem. In this paper, we design a distributed framework for safe multi-agent control in large-scale environments with obstacles, where a large number of agents are required to maintain safety using only local information and reach their goal locations. We introduce a new class of certificates, termed graph control barrier function (GCBF), which are based on the well-established control barrier function (CBF) theory for safety guarantees and utilize a graph structure for scalable and generalizable distributed control of MAS. We develop a novel theoretical framework to prove the safety of an arbitrary-sized MAS with a single GCBF. We propose a new training framework GCBF+ that uses graph neural networks (GNNs) to parameterize a candidate GCBF and a distributed control policy. The proposed framework is distributed and is capable of directly taking point clouds from LiDAR, instead of actual state information, for real-world robotic applications. We illustrate the efficacy of the proposed method through various hardware experiments on a swarm of drones with objectives ranging from exchanging positions to docking on a moving target without collision. Additionally, we perform extensive numerical experiments, where the number and density of agents, as well as the number of obstacles, increase. Empirical results show that in complex environments with nonlinear agents (e.g., Crazyflie drones) GCBF+ outperforms the handcrafted CBF-based method with the best performance by up to 20% for relatively small-scale MAS for up to 256 agents, and leading reinforcement learning (RL) methods by up to 40% for MAS with 1024 agents. Furthermore, the proposed method does not compromise on the performance, in terms of goal reaching, for achieving high safety rates, which is a common trade-off in RL-based methods.
arxiv情報
著者 | Songyuan Zhang,Oswin So,Kunal Garg,Chuchu Fan |
発行日 | 2024-01-25 22:49:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google