Decentralized Multi-Agent Active Search and Tracking when Targets Outnumber Agents

要約

マルチエージェントによるマルチターゲット追跡は、野生動物のパトロール、セキュリティ監視、環境監視など、幅広い用途に利用できます。
このようなアルゴリズムでは、多くの場合、限定的な仮定が行われます。つまり、ターゲットの数および/またはその初期位置が既知であると仮定されたり、環境の独立した区画を監視するためにエージェントが事前に割り当てられたりして、探索の負担が軽減されることがあります。
また、エージェントが視野内のターゲットを継続的に追跡できないため、エージェントの数がターゲットよりも少ない場合、これは適用性を制限します。
マルチエージェント追跡アルゴリズムはさらに、エージェント間の観察の同期、または共同行動を調整するための中央コントローラーの存在を前提としています。
代わりに、非同期エージェント間通信を使用した、分散型マルチエージェント、マルチターゲット、同時アクティブ検索および追跡の設定に焦点を当てます。
私たちが提案するアルゴリズム DecSTER は、分散型マルチエージェント意思決定のためのトンプソン サンプリングと組み合わせた事後推論のための確率仮説密度フィルターの逐次モンテカルロ実装を使用します。
ターゲットの数がエージェントの数を上回るシナリオに焦点を当てて、さまざまなアクション選択ポリシーを比較します。
シミュレーションでは、DecSTER が信頼性の低いエージェント間通信に対して堅牢であり、ターゲットの数やチームサイズが異なる場合でも、最適サブパターン割り当て (OSPA) メトリクスの点で情報に貪欲なベースラインを上回るパフォーマンスを示します。

要約(オリジナル)

Multi-agent multi-target tracking has a wide range of applications, including wildlife patrolling, security surveillance or environment monitoring. Such algorithms often make restrictive assumptions: the number of targets and/or their initial locations may be assumed known, or agents may be pre-assigned to monitor disjoint partitions of the environment, reducing the burden of exploration. This also limits applicability when there are fewer agents than targets, since agents are unable to continuously follow the targets in their fields of view. Multi-agent tracking algorithms additionally assume inter-agent synchronization of observations, or the presence of a central controller to coordinate joint actions. Instead, we focus on the setting of decentralized multi-agent, multi-target, simultaneous active search-and-tracking with asynchronous inter-agent communication. Our proposed algorithm DecSTER uses a sequential monte carlo implementation of the probability hypothesis density filter for posterior inference combined with Thompson sampling for decentralized multi-agent decision making. We compare different action selection policies, focusing on scenarios where targets outnumber agents. In simulation, we demonstrate that DecSTER is robust to unreliable inter-agent communication and outperforms information-greedy baselines in terms of the Optimal Sub-Pattern Assignment (OSPA) metric for different numbers of targets and varying teamsizes.

arxiv情報

著者 Arundhati Banerjee,Jeff Schneider
発行日 2024-01-06 08:10:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.MA, cs.RO, I.2.11 パーマリンク