要約
未知の空間の統計を予測することにより、構造化された未知の環境でマルチロボットチームのための効率的で信頼性の高い目標指向の長期ナビゲーションのための新しいアプローチを提示します。
不確実性の下での学習拡張モデルベースの計画に関する最近の研究に基づいて、困難な Dec-POMDP を扱いやすい確率的 MDP に近似できる高レベルの状態とアクションの抽象化を導入します。
当社のマルチロボット学習オーバー サブゴール プランナー (MR-LSP) は、目に見えない目標に到達する可能性が高い領域の調整された探索に向けてエージェントを導きます。
他のマルチロボット戦略に対するコストの改善を示しています。
シミュレートされたオフィスのような環境では、標準的な学習されていない楽観的な計画と学習に基づくベースラインに対して、私たちのアプローチが 13.29% (ロボット 2 台) および 4.6% (ロボット 3 台) の平均コストを節約することを示しています。
要約(オリジナル)
We present a novel approach for efficient and reliable goal-directed long-horizon navigation for a multi-robot team in a structured, unknown environment by predicting statistics of unknown space. Building on recent work in learning-augmented model based planning under uncertainty, we introduce a high-level state and action abstraction that lets us approximate the challenging Dec-POMDP into a tractable stochastic MDP. Our Multi-Robot Learning over Subgoals Planner (MR-LSP) guides agents towards coordinated exploration of regions more likely to reach the unseen goal. We demonstrate improvement in cost against other multi-robot strategies; in simulated office-like environments, we show that our approach saves 13.29% (2 robot) and 4.6% (3 robot) average cost versus standard non-learned optimistic planning and a learning-informed baseline.
arxiv情報
著者 | Abhish Khanal,Gregory J. Stein |
発行日 | 2023-03-29 13:02:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google