Optimal Task Assignment and Path Planning using Conflict-Based Search with Precedence and Temporal Constraints


マルチエージェント パス検索 (MAPF) 問題には、一連のエージェントの衝突のないパスを見つけて、それらのエージェントを開始位置からゴール位置まで導くことが必要です。
ただし、MAPF では、いくつかの実際的なタスク関連の制約が考慮されていません。
タスク割り当て、パス計画、およびユーザー定義の目標を一貫したフレームワークに組み込むために、このペーパーでは、優先順位と時間的制約を伴うタスク割り当てとパス検索 (TAPF-PTC) 問題を検討します。
競合ベースの検索 (CBS) を強化して、優先順位と時間的制約に従うタスク割り当てと衝突のないパスを同時に生成し、強化学習 (RL) におけるユーザー定義の報酬関数からのリターンによって定量化される目標を最大化します。
実験的に、私たちのアルゴリズム CBS-TA-PTC が、MARL および適応されたターゲット割り当ておよび経路探索 (TAPF) 手法と比較して、優先順位と時間的制約のある非常に困難な爆弾解除タスクを効率的に解決できることを実証します。


The Multi-Agent Path Finding (MAPF) problem entails finding collision-free paths for a set of agents, guiding them from their start to goal locations. However, MAPF does not account for several practical task-related constraints. For example, agents may need to perform actions at goal locations with specific execution times, adhering to predetermined orders and timeframes. Moreover, goal assignments may not be predefined for agents, and the optimization objective may lack an explicit definition. To incorporate task assignment, path planning, and a user-defined objective into a coherent framework, this paper examines the Task Assignment and Path Finding with Precedence and Temporal Constraints (TAPF-PTC) problem. We augment Conflict-Based Search (CBS) to simultaneously generate task assignments and collision-free paths that adhere to precedence and temporal constraints, maximizing an objective quantified by the return from a user-defined reward function in reinforcement learning (RL). Experimentally, we demonstrate that our algorithm, CBS-TA-PTC, can solve highly challenging bomb-defusing tasks with precedence and temporal constraints efficiently relative to MARL and adapted Target Assignment and Path Finding (TAPF) methods.


著者 Yu Quan Chong,Jiaoyang Li,Katia Sycara
発行日 2024-04-11 16:33:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MA, I.2.11 パーマリンク