要約
部分的に観測可能な複数の部屋の環境における複数オブジェクトの再配置問題を解決するためのオンライン計画フレームワークを紹介します。
現在のオブジェクト再配置ソリューションは、主に強化学習や手作業でコーディングされた計画手法に基づいており、多くの場合、さまざまな課題への適応性に欠けています。
この制限に対処するために、新しい階層オブジェクト指向部分観察マルコフ決定プロセス (HOO-POMDP) 計画アプローチを導入します。
このアプローチは、(a) サブ目標を生成するオブジェクト指向の POMDP プランナー、(b) サブ目標を達成するための低レベルのポリシーのセット、および (c) 連続的な低レベルの世界を抽象化システムで構成します。
抽象的な計画に適した表現。
AI2-THOR シミュレート環境でさまざまな数のオブジェクト、部屋、問題の種類についてシステムを評価し、有望な結果が得られました。
要約(オリジナル)
We present an online planning framework for solving multi-object rearrangement problems in partially observable, multi-room environments. Current object rearrangement solutions, primarily based on Reinforcement Learning or hand-coded planning methods, often lack adaptability to diverse challenges. To address this limitation, we introduce a novel Hierarchical Object-Oriented Partially Observed Markov Decision Process (HOO-POMDP) planning approach. This approach comprises of (a) an object-oriented POMDP planner generating sub-goals, (b) a set of low-level policies for sub-goal achievement, and (c) an abstraction system converting the continuous low-level world into a representation suitable for abstract planning. We evaluate our system on varying numbers of objects, rooms, and problem types in AI2-THOR simulated environments with promising results.
arxiv情報
著者 | Rajesh Mangannavar,Alan Fern,Prasad Tadepalli |
発行日 | 2025-01-08 18:20:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google