Towards Physically Talented Aerial Robots with Tactically Smart Swarm Behavior thereof: An Efficient Co-design Approach

要約

ロボットの群れなどの協調自律システムの集団的なパフォーマンスや能力は、その集団内の個々のシステムの形態や動作によって共同で影響を受けます。
その文脈で、この論文では、形態学が偵察や捜索救助を行う無人の空中/地上ロボットの学習された戦術的行動にどのような影響を与えるかを調査します。
これは、群ロボットの形態と戦術的動作を共同で最適化するというこの困難な問題を解決するための、計算効率の高いフレームワークを提示することによって達成されます。
この目的のための重要な新規開発には、身体的才能メトリクスの使用とグラフ強化学習アーキテクチャの修正が含まれ、これにより、移動性とオブジェクト/オブジェクトを制限する群戦術方針と才能メトリクス (探索速度、飛行範囲、巡航速度) の共同学習が可能になります。
これらの戦術を実行する航空機ロボットの犠牲者捜索能力。
この共同設計アプローチの実装は、可変航空資産機能の使用を可能にするオープンソースの Pybullet ベースの群れシミュレーターの進歩によってサポートされています。
共同設計の結果は、ミッションのパフォーマンス指標の観点から比較すると、固定パレート設計での戦術学習の結果よりも優れていることが観察されています。
ベースライン設計と共同設計の結果を比較すると、形態と学習された動作の大きな違いも観察されます。

要約(オリジナル)

The collective performance or capacity of collaborative autonomous systems such as a swarm of robots is jointly influenced by the morphology and the behavior of individual systems in that collective. In that context, this paper explores how morphology impacts the learned tactical behavior of unmanned aerial/ground robots performing reconnaissance and search & rescue. This is achieved by presenting a computationally efficient framework to solve this otherwise challenging problem of jointly optimizing the morphology and tactical behavior of swarm robots. Key novel developments to this end include the use of physical talent metrics and modification of graph reinforcement learning architectures to allow joint learning of the swarm tactical policy and the talent metrics (search speed, flight range, and cruising speed) that constrain mobility and object/victim search capabilities of the aerial robots executing these tactics. Implementation of this co-design approach is supported by advancements to an open-source Pybullet-based swarm simulator that allows the use of variable aerial asset capabilities. The results of the co-design are observed to outperform those of tactics learning with a fixed Pareto design, when compared in terms of mission performance metrics. Significant differences in morphology and learned behavior are also observed by comparing the baseline design and the co-design outcomes.

arxiv情報

著者 Prajit KrisshnaKumar,Steve Paul,Hemanth Manjunatha,Mary Corra,Ehsan Esfahani,Souma Chowdhury
発行日 2024-06-24 12:52:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.MA, cs.RO パーマリンク