An Adaptive Fuzzy Reinforcement Learning Cooperative Approach for the Autonomous Control of Flock Systems

要約

群れ誘導問題は、複数の最適化目標が同時に解決される困難な構造を楽しんでいます。
これには通常、誘導、衝突回避、結束など、さまざまな目的に取り組むためにさまざまな制御アプローチが必要です。
特に、誘導スキームは、複雑な追跡エラーのダイナミクスに長い間悩まされてきました。
さらに、平衡状態で得られた線形フィードバック戦略に基づく手法は、不確実な動的環境に適用すると保持されないか、劣化する可能性があります。
事前調整されたファジー推論アーキテクチャは、このようなモデル化されていない条件下では堅牢性に欠けます。
この作品は、群れシステムの自律制御のための適応分散技術を紹介します。
その比較的柔軟な構造は、多数の目的を同時にターゲットとするオンラインのファジー強化学習スキームに基づいています。
つまり、リーダーに従い、衝突を回避し、群れの速度のコンセンサスに到達します。
動的外乱に直面したときの回復力に加えて、アルゴリズムはフィードバック信号としてエージェントの位置以上のものを必要としません。
提案された方法の有効性は、2 つのシミュレーション シナリオで検証され、文献からの同様の手法に対してベンチマークされます。

要約(オリジナル)

The flock-guidance problem enjoys a challenging structure where multiple optimization objectives are solved simultaneously. This usually necessitates different control approaches to tackle various objectives, such as guidance, collision avoidance, and cohesion. The guidance schemes, in particular, have long suffered from complex tracking-error dynamics. Furthermore, techniques that are based on linear feedback strategies obtained at equilibrium conditions either may not hold or degrade when applied to uncertain dynamic environments. Pre-tuned fuzzy inference architectures lack robustness under such unmodeled conditions. This work introduces an adaptive distributed technique for the autonomous control of flock systems. Its relatively flexible structure is based on online fuzzy reinforcement learning schemes which simultaneously target a number of objectives; namely, following a leader, avoiding collision, and reaching a flock velocity consensus. In addition to its resilience in the face of dynamic disturbances, the algorithm does not require more than the agent position as a feedback signal. The effectiveness of the proposed method is validated with two simulation scenarios and benchmarked against a similar technique from the literature.

arxiv情報

著者 Shuzheng Qu,Mohammed Abouheaf,Wail Gueaieb,Davide Spinello
発行日 2023-03-17 13:07:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, cs.RO, cs.SY, eess.SY パーマリンク