要約
この作業は、未知のロボット遷移モデルの下でのマルチロボット調整の問題に対処し、時間ウィンドウの時間的論理によって指定されたタスクがユーザー定義の確率のしきい値に満たされることを保証します。
(i)ロボットの推定タスク完了確率と予想される報酬に基づいてタスクが割り当てられる高レベルのタスク割り当て、および(ii)ロボットの低レベル分散ポリシー学習と実行を統合するBIレベルのフレームワークを提示します。
割り当てられたタスクを満たしながら、補助報酬を独立して最適化します。
ロボットダイナミクスの不確実性を処理するために、当社のアプローチは、リアルタイムタスク実行データを活用して、予想されるタスク完了確率と報酬を繰り返し改善し、明示的なロボット遷移モデルなしで適応型タスク割り当てを可能にします。
提案されたアルゴリズムを理論的に検証し、タスクの割り当てが望ましい確率のしきい値を高い信頼性で満たしていることを示しています。
最後に、包括的なシミュレーションを通じてフレームワークの有効性を実証します。
要約(オリジナル)
This work addresses the problem of multi-robot coordination under unknown robot transition models, ensuring that tasks specified by Time Window Temporal Logic are satisfied with user-defined probability thresholds. We present a bi-level framework that integrates (i) high-level task allocation, where tasks are assigned based on the robots’ estimated task completion probabilities and expected rewards, and (ii) low-level distributed policy learning and execution, where robots independently optimize auxiliary rewards while fulfilling their assigned tasks. To handle uncertainty in robot dynamics, our approach leverages real-time task execution data to iteratively refine expected task completion probabilities and rewards, enabling adaptive task allocation without explicit robot transition models. We theoretically validate the proposed algorithm, demonstrating that the task assignments meet the desired probability thresholds with high confidence. Finally, we demonstrate the effectiveness of our framework through comprehensive simulations.
arxiv情報
著者 | Xiaoshan Lin,Roberto Tron |
発行日 | 2025-02-14 10:39:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google