Learning Environment-Aware Control Barrier Functions for Safe and Feasible Multi-Robot Navigation

要約

コントロール バリア機能 (CBF) は、ロボット ナビゲーションの安全性を保証するために適用されています。
従来のアプローチでは、ナビゲーション中に固定 CBF を考慮し、基礎となるパラメーターをアプリオリに手動で調整します。
このようなアプローチは非効率的であり、環境の変化に対して脆弱です。
この論文の目的は、ロボットが環境について何を認識しているかに基づいて、マルチロボット ナビゲーションの CBF を学習することです。
ロボットの安全性を確保しながらナビゲーション タスクの実現可能性を保証するために、動的環境認識 CBF 制約を定義することにより、ロボットの動作における保守性と攻撃性の間のトレードオフを追求します。
CBF の制約とナビゲーション パフォーマンスの間の明示的な関係をモデル化するのは難しいため、強化学習を活用して、モデルを使用しない方法で時変 CBF を学習します。
グラフ ニューラル ネットワーク (GNN) を使用して CBF ポリシーをパラメーター化し、翻訳不変で順列同変の GNN を設計して、環境全体で一般化する分散型ポリシーを合成します。
提案されたアプローチは、ナビゲーション パフォーマンスを最適化しながら (報酬ベースの学習による) 安全性の保証を維持します (基礎となる CBF による)。
提案されたアプローチを、徹底的なグリッド検索によって調整された固定 CBF と比較するシミュレーションを実行します。
結果は、環境認識CBFがロボットの動きや障害物の変化に適応できることを示しており、ナビゲーション性能の向上と堅牢な一般化をもたらします。

要約(オリジナル)

Control Barrier Functions (CBFs) have been applied to provide safety guarantees for robot navigation. Traditional approaches consider fixed CBFs during navigation and hand-tune the underlying parameters apriori. Such approaches are inefficient and vulnerable to changes in the environment. The goal of this paper is to learn CBFs for multi-robot navigation based on what robots perceive about their environment. In order to guarantee the feasibility of the navigation task, while ensuring robot safety, we pursue a trade-off between conservativeness and aggressiveness in robot behavior by defining dynamic environment-aware CBF constraints. Since the explicit relationship between CBF constraints and navigation performance is challenging to model, we leverage reinforcement learning to learn time-varying CBFs in a model-free manner. We parameterize the CBF policy with graph neural networks (GNNs), and design GNNs that are translation invariant and permutation equivariant, to synthesize decentralized policies that generalize across environments. The proposed approach maintains safety guarantees (due to the underlying CBFs), while optimizing navigation performance (due to the reward-based learning). We perform simulations that compare the proposed approach with fixed CBFs tuned by exhaustive grid-search. The results show that environment-aware CBFs are capable of adapting to robot movements and obstacle changes, yielding improved navigation performance and robust generalization.

arxiv情報

著者 Zhan Gao,Guang Yang,Amanda Prorok
発行日 2023-03-08 01:28:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, cs.RO パーマリンク