Cooperative and Asynchronous Transformer-based Mission Planning for Heterogeneous Teams of Mobile Robots

要約

捜索や救助などのタスクのために、移動ロボットの異種チームを調整することは非常に困難です。
これは、エージェントの非同期操作、制約された通信、および限られた計算リソースを伴う、このような環境における認識、意思決定、および計画の複雑さによるものです。
このペーパーでは、マルチエージェント強化学習 (MARL) を活用して、異種のセンシング、動作、および作動機能を備えたエージェントを効果的に調整する、協調的かつ非同期のトランスフォーマーベースのミッション計画 (CATMiP) フレームワークについて説明します。
このフレームワークでは、クラスベースのマクロアクション分散部分観察マルコフ決定プロセス (CMD-POMDP) モデルが導入され、マクロアクションを介してさまざまなエージェント クラス間の非同期意思決定を処理します。
また、Multi-Agent Transformer (MAT) アーキテクチャを拡張して、エージェント間の分散アドホック通信を容易にします。
CATMiP は、ミッションの複雑さや通信の制約に簡単に適応し、さまざまな環境の規模やチーム構成に合わせて拡張できます。
シミュレーションでは、厳しい通信制約下でも、その拡張性と、2 つのクラスの探検家エージェントと救助エージェントと協力してミッション目標を達成できる能力を実証しています。
コードは https://github.com/mylad13/CATMiP で入手できます。

要約(オリジナル)

Coordinating heterogeneous teams of mobile robots for tasks such as search and rescue is highly challenging. This is due to the complexities of perception, decision making and planning in such environments, with agents’ non-synchronous operation, constrained communication, and limited computational resources. This paper presents the Cooperative and Asynchronous Transformer-based Mission Planning (CATMiP) framework, which leverages multi-agent reinforcement learning (MARL) to effectively coordinate agents with heterogeneous sensing, motion, and actuation capabilities. The framework introduces a Class-based Macro-Action Decentralized Partially Observable Markov Decision Process (CMD-POMDP) model to handle asynchronous decision-making among different agent classes via macro-actions. It also extends the Multi-Agent Transformer (MAT) architecture to facilitate distributed, ad hoc communication among the agents. CATMiP easily adapts to mission complexities and communication constraints, and scales to varying environment sizes and team compositions. Simulations demonstrate its scalability and ability to achieve cooperative mission objectives with two classes of explorer and rescuer agents, even under severe communication constraints. The code is available at https://github.com/mylad13/CATMiP.

arxiv情報

著者 Milad Farjadnasab,Shahin Sirouspour
発行日 2024-10-08 21:14:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, I.2.11 パーマリンク