Safe multi-agent motion planning under uncertainty for drones using filtered reinforcement learning

要約

私たちは、不確実で乱雑な作業空間におけるドローンの安全なマルチエージェント動作計画の問題を検討します。
この問題に対して、強化学習と制約制御ベースの軌道計画の長所に基づいて構築された扱いやすいモーション プランナーを紹介します。
まず、シングルエージェント強化学習を使用して、ターゲットに到達しても衝突が発生しない可能性があるデータから動作プランを学習します。
次に、ワークスペース、エージェントの動作、およびセンシングにおける不確実性にもかかわらず、安全性を確保するために、凸型最適化、チャンス制約、および制約付き制御のセットベースの手法を使用します。
提案されたアプローチは、エージェントの状態と制御の制約を処理し、エージェント間およびワークスペース内の静的な障害物との衝突回避を高い確率で強制できます。
提案されたアプローチは、学習のみに基づく方法よりもトレーニングが簡単な、安全でリアルタイムに実装可能なマルチエージェント モーション プランナーを実現します。
数値シミュレーションと実験により、このアプローチの有効性が示されています。

要約(オリジナル)

We consider the problem of safe multi-agent motion planning for drones in uncertain, cluttered workspaces. For this problem, we present a tractable motion planner that builds upon the strengths of reinforcement learning and constrained-control-based trajectory planning. First, we use single-agent reinforcement learning to learn motion plans from data that reach the target but may not be collision-free. Next, we use a convex optimization, chance constraints, and set-based methods for constrained control to ensure safety, despite the uncertainty in the workspace, agent motion, and sensing. The proposed approach can handle state and control constraints on the agents, and enforce collision avoidance among themselves and with static obstacles in the workspace with high probability. The proposed approach yields a safe, real-time implementable, multi-agent motion planner that is simpler to train than methods based solely on learning. Numerical simulations and experiments show the efficacy of the approach.

arxiv情報

著者 Sleiman Safaoui,Abraham P. Vinod,Ankush Chakrabarty,Rien Quirynen,Nobuyuki Yoshikawa,Stefano Di Cairano
発行日 2023-10-31 18:09:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.MA, cs.RO, cs.SY, eess.SY パーマリンク