要約
協同組合の自律的なロボットシステムは、スペース、空気、地面、および海上ドメインを越えて複雑なマルチタスクミッションを実行する可能性があります。
しかし、それらは一般的にリモートで動的で危険な環境で動作し、集中的な計算に脆弱なまたは遅い通信リンクに依存せずに、迅速な内容適応を必要とします。
したがって、回復力を高めるには、高速でオンボードの再生アルゴリズムが必要です。
補強学習は、旅行営業担当者の問題(TSP)として策定された場合、ミッション計画タスクを効率的に解決するための強い約束を示していますが、既存の方法は次のとおりです。
2)エージェント間の協力を許可しないでください。
3)さまざまな期間でタスクをモデル化できません。
または4)オンボード展開に関する実用的な考慮事項がない。
ここでは、これらの問題を克服するための適応を備えた複数TSPの新しいバリアントとして協同ミッションの再生問題を定義し、グラフ注意ネットワークと注意モデルを使用して効果的かつ効率的に解決するための新しいエンコーダー/デコーダーベースのモデルを開発します。
協力的なドローンの簡単な例を使用して、Replannerが一貫して(90%の時間)、最先端のLKH3ヒューリスティックソルバーの10%以内のパフォーマンスを維持し、ラズベリーPIで85〜370倍速く走ることを示します。
この作業は、自律的なマルチエージェントシステムの回復力を高める道を開きます。
要約(オリジナル)
Cooperative autonomous robotic systems have significant potential for executing complex multi-task missions across space, air, ground, and maritime domains. But they commonly operate in remote, dynamic and hazardous environments, requiring rapid in-mission adaptation without reliance on fragile or slow communication links to centralised compute. Fast, on-board replanning algorithms are therefore needed to enhance resilience. Reinforcement Learning shows strong promise for efficiently solving mission planning tasks when formulated as Travelling Salesperson Problems (TSPs), but existing methods: 1) are unsuitable for replanning, where agents do not start at a single location; 2) do not allow cooperation between agents; 3) are unable to model tasks with variable durations; or 4) lack practical considerations for on-board deployment. Here we define the Cooperative Mission Replanning Problem as a novel variant of multiple TSP with adaptations to overcome these issues, and develop a new encoder/decoder-based model using Graph Attention Networks and Attention Models to solve it effectively and efficiently. Using a simple example of cooperative drones, we show our replanner consistently (90% of the time) maintains performance within 10% of the state-of-the-art LKH3 heuristic solver, whilst running 85-370 times faster on a Raspberry Pi. This work paves the way for increased resilience in autonomous multi-agent systems.
arxiv情報
著者 | Elim Kwan,Rehman Qureshi,Liam Fletcher,Colin Laganier,Victoria Nockles,Richard Walters |
発行日 | 2025-06-06 13:54:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google