Learning to Navigate in Turbulent Flows with Aerial Robot Swarms: A Cooperative Deep Reinforcement Learning Approach

要約

乱流環境での空中操作は、流れの無秩序な挙動のため、困難な問題です。
この問題は、航空機ロボットのチームが乱流条件下で協調動作を実現しようとすると、さらに複雑になります。
この論文では、ネストされた制御アーキテクチャを介して軌道追跡制御を乱流補償から切り離し、乱流内を航行するための新しいマルチロボット コントローラーを紹介します。
以前の研究とは異なり、私たちの方法は特定の時間と空間での空気の流れを補正することを学習しません。
代わりに、私たちの方法は、チームへの影響に基づいてフローを補正することを学習します。
これは、グラフ畳み込みニューラル ネットワーク (GCNN) ベースのアーキテクチャを介して実装された深層強化学習アプローチによって可能になり、ロボットがチーム全体の風の流れの時空間相関を処理することで、より優れた風補償を実現できるようになります。
私たちのアプローチは、各ロボットが最も近い近隣からの情報のみを使用するため、大規模なロボット チームにうまく拡張でき、トレーニングで見られたよりも大きなロボット チームにもうまく一般化できます。
模擬実験では、情報共有により航空機ロボットのチームにおける乱流補償がどのように改善されるかを実証し、さまざまなチーム構成に対する本手法の柔軟性を実証します。

要約(オリジナル)

Aerial operation in turbulent environments is a challenging problem due to the chaotic behavior of the flow. This problem is made even more complex when a team of aerial robots is trying to achieve coordinated motion in turbulent wind conditions. In this paper, we present a novel multi-robot controller to navigate in turbulent flows, decoupling the trajectory-tracking control from the turbulence compensation via a nested control architecture. Unlike previous works, our method does not learn to compensate for the air-flow at a specific time and space. Instead, our method learns to compensate for the flow based on its effect on the team. This is made possible via a deep reinforcement learning approach, implemented via a Graph Convolutional Neural Network (GCNN)-based architecture, which enables robots to achieve better wind compensation by processing the spatial-temporal correlation of wind flows across the team. Our approach scales well to large robot teams — as each robot only uses information from its nearest neighbors — , and generalizes well to robot teams larger than seen in training. Simulated experiments demonstrate how information sharing improves turbulence compensation in a team of aerial robots and demonstrate the flexibility of our method over different team configurations.

arxiv情報

著者 Diego Patiño,Siddharth Mayya,Juan Calderon,Kostas Daniilidis,David Saldaña
発行日 2023-06-07 21:02:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, cs.RO パーマリンク