DMCA: Dense Multi-agent Navigation using Attention and Communication

要約

分散型マルチロボットナビゲーションでは、限られた環境意識で安全かつ効率的な移動を確保することが依然として課題です。
従来、ロボットは現地の観察に基づいて移動していましたが、このアプローチは複雑な環境ではうまくいきません。
考えられる解決策は、エージェント間のコミュニケーションを通じて世界への理解を高めることですが、単なる情報ブロードキャストでは効率が不十分です。
この研究では、分散型マルチロボット衝突回避と選択的なエージェント間通信を同時に学習することで、この問題に対処します。
私たちは、隣接するロボットからの観察可能な情報を簡潔な固定長の観察ベクトルにエンコードするマルチヘッド自己注意メカニズムを使用し、それによってさまざまな数の隣接ロボットを処理します。
私たちの手法は、選択的な通信を通じてナビゲーションのパフォーマンスを向上させることに焦点を当てています。
通信の選択をリンク予測問題として投影します。この問題では、ネットワークは、観察可能な状態情報に基づいて、特定の近隣との通信リンクを確立する必要性を判断します。
通信された情報は近隣住民の観察を強化し、適切なナビゲーション計画の選択に役立ちます。
ネットワークをエンドツーエンドでトレーニングすることにより、観測エンコーダ、通信選択、およびナビゲーション コンポーネントの最適な重みを同時に学習します。
私たちは、密集した困難な環境であっても、複数のロボット間で安全かつ効率的なナビゲーションを実現することで、私たちのアプローチの利点を実証します。
さまざまな学習ベースおよびモデルベースのベースラインとの比較評価により、当社の優れたナビゲーション パフォーマンスが実証され、複雑な評価シナリオでの成功率が最大 24% という大幅な向上をもたらしました。

要約(オリジナル)

In decentralized multi-robot navigation, ensuring safe and efficient movement with limited environmental awareness remains a challenge. While robots traditionally navigate based on local observations, this approach falters in complex environments. A possible solution is to enhance understanding of the world through inter-agent communication, but mere information broadcasting falls short in efficiency. In this work, we address this problem by simultaneously learning decentralized multi-robot collision avoidance and selective inter-agent communication. We use a multi-head self-attention mechanism that encodes observable information from neighboring robots into a concise and fixed-length observation vector, thereby handling varying numbers of neighbors. Our method focuses on improving navigation performance through selective communication. We cast the communication selection as a link prediction problem, where the network determines the necessity of establishing a communication link with a specific neighbor based on the observable state information. The communicated information enhances the neighbor’s observation and aids in selecting an appropriate navigation plan. By training the network end-to-end, we concurrently learn the optimal weights for the observation encoder, communication selection, and navigation components. We showcase the benefits of our approach by achieving safe and efficient navigation among multiple robots, even in dense and challenging environments. Comparative evaluations against various learning-based and model-based baselines demonstrate our superior navigation performance, resulting in an impressive improvement of up to 24% in success rate within complex evaluation scenarios.

arxiv情報

著者 Senthil Hariharan Arul,Amrit Singh Bedi,Dinesh Manocha
発行日 2024-06-25 18:22:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク