要約
共有の動的環境で連携する大規模なマルチエージェント システムには、効率的な調整と計画が不可欠です。
ヒューリスティックな検索方法や学習ベースのアプローチでは、正確性やパフォーマンスが保証されていないことがよくあります。
さらに、共同タスクに空間的要件と時間的要件の両方が含まれる場合、たとえば線形時相論理 (LTL) 式など、形式的手法はタスク計画のための検証可能なフレームワークを提供します。
ただし、計画の複雑さはエージェントの数とタスクの式の長さに応じて指数関数的に増加するため、既存の研究はほとんどが小規模な人為的なケースに限定されています。
この問題に対処するために、この研究では、オンラインで継続的にリリースされるシステム全体の一時的なタスクの式に対して、新しい計画パラダイムが提案されています。
これにより、従来の方法における 2 つの一般的なボトルネックが回避されます。つまり、(i) 完全なタスク式を関連する B\’uchi オートマトンに直接変換する。
(ii) B\’uchi オートマトンとすべてのエージェントの遷移モデル間の同期生成物。
代わりに、緩和された部分順序セット (R ポーズ) の積をオンザフライで計算し、これらのサブタスクを順序制約に従ってエージェントに割り当てる適応型計画アルゴリズムが提案されています。
最初の有効な計画は、多項式時間とメモリの複雑さを考慮して導出できることが示されています。
システムのサイズと式の長さ。
私たちの方法は、長さが 400 を超えるタスク式と、$400$ を超えるエージェントを含むフリートを考慮できますが、既存のほとんどの方法は、妥当な期間内に式の長さが 25 になると失敗します。
提案された方法は、シミュレーションとハードウェア実験の両方で、サービス ロボットの大規模なフリートで検証されています。
要約(オリジナル)
Efficient coordination and planning is essential for large-scale multi-agent systems that collaborate in a shared dynamic environment. Heuristic search methods or learning-based approaches often lack the guarantee on correctness and performance. Moreover, when the collaborative tasks contain both spatial and temporal requirements, e.g., as Linear Temporal Logic (LTL) formulas, formal methods provide a verifiable framework for task planning. However, since the planning complexity grows exponentially with the number of agents and the length of the task formula, existing studies are mostly limited to small artificial cases. To address this issue, a new planning paradigm is proposed in this work for system-wide temporal task formulas that are released online and continually. It avoids two common bottlenecks in the traditional methods, i.e., (i) the direct translation of the complete task formula to the associated B\’uchi automaton; and (ii) the synchronized product between the B\’uchi automaton and the transition models of all agents. Instead, an adaptive planning algorithm is proposed that computes the product of relaxed partially-ordered sets (R-posets) on-the-fly, and assigns these subtasks to the agents subject to the ordering constraints. It is shown that the first valid plan can be derived with a polynomial time and memory complexity w.r.t. the system size and the formula length. Our method can take into account task formulas with a length of more than 400 and a fleet with more than $400$ agents, while most existing methods fail at the formula length of 25 within a reasonable duration. The proposed method is validated on large fleets of service robots in both simulation and hardware experiments.
arxiv情報
著者 | Zesen Liu,Meng Guo,Weimin Bao,Zhongkui Li |
発行日 | 2024-04-09 14:01:16+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google