要約
大規模なマルチエージェントシステムの分散、スケーラブル、安全な制御は、困難な問題です。
このホワイトペーパーでは、障害物を備えた大規模な環境で安全なマルチエージェント制御のための分散フレームワークを設計します。そこでは、ローカル情報のみを使用して安全を維持し、目標の場所に到達するために多数のエージェントが必要です。
安全保証のために確立された制御障壁機能理論に基づいたグラフ制御バリア関数(GCBF)と呼ばれる新しいクラスの証明書を導入し、MASのスケーラブルで一般化可能な分散制御のためのグラフ構造を利用します。
単一のGCBFを使用した任意のサイズのMASの安全性を証明するために、新しい理論的枠組みを開発します。
グラフニューラルネットワークを使用して候補GCBFと分散制御ポリシーをパラメーター化する新しいトレーニングフレームワークGCBF+を提案します。
提案されたフレームワークは配布されており、実際のロボットアプリケーションのために、実際の状態情報の代わりにLidarからポイントクラウドを取得することができます。
ドローンの群れでのさまざまなハードウェア実験を通じて、衝突せずに位置を交換することから移動ターゲットのドッキングに至るまでの目的を持つさまざまなハードウェア実験を通じて、提案された方法の有効性を説明します。
さらに、エージェントの数と密度、および障害物の数が増加する広範な数値実験を実行します。
経験的結果は、非線形ダイナミクスを持つエージェント(クレイジーフリードローンなど)を備えた複雑な環境では、GCBF+が256のエージェントを持つ比較的小規模なMASで最高のパフォーマンスを持つ手作りのCBFベースの方法を最大20%上回ることを示しています。
1024エージェントのMASで最大40%の主要な強化学習(RL)方法。
さらに、提案された方法は、RLベースの方法で一般的なトレードオフである高い安全率を達成するために、目標到達の観点から、パフォーマンスを妥協しません。
要約(オリジナル)
Distributed, scalable, and safe control of large-scale multi-agent systems is a challenging problem. In this paper, we design a distributed framework for safe multi-agent control in large-scale environments with obstacles, where a large number of agents are required to maintain safety using only local information and reach their goal locations. We introduce a new class of certificates, termed graph control barrier function (GCBF), which are based on the well-established control barrier function theory for safety guarantees and utilize a graph structure for scalable and generalizable distributed control of MAS. We develop a novel theoretical framework to prove the safety of an arbitrary-sized MAS with a single GCBF. We propose a new training framework GCBF+ that uses graph neural networks to parameterize a candidate GCBF and a distributed control policy. The proposed framework is distributed and is capable of taking point clouds from LiDAR, instead of actual state information, for real-world robotic applications. We illustrate the efficacy of the proposed method through various hardware experiments on a swarm of drones with objectives ranging from exchanging positions to docking on a moving target without collision. Additionally, we perform extensive numerical experiments, where the number and density of agents, as well as the number of obstacles, increase. Empirical results show that in complex environments with agents with nonlinear dynamics (e.g., Crazyflie drones), GCBF+ outperforms the hand-crafted CBF-based method with the best performance by up to 20% for relatively small-scale MAS with up to 256 agents, and leading reinforcement learning (RL) methods by up to 40% for MAS with 1024 agents. Furthermore, the proposed method does not compromise on the performance, in terms of goal reaching, for achieving high safety rates, which is a common trade-off in RL-based methods.
arxiv情報
著者 | Songyuan Zhang,Oswin So,Kunal Garg,Chuchu Fan |
発行日 | 2025-01-27 21:07:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google