Measurement Simplification in ρ-POMDP with Performance Guarantees

要約

不確実性の下での意思決定は、不完全な情報を使って動作する自律システムの核心です。
意思決定の問題を解決するコストは、アクションおよび観察の空間では指数関数的に増大するため、多くのオンライン システムでは実行不可能になります。
この論文では、高次元の観察空間を分割することにより、効率的な意思決定を行うための新しいアプローチを紹介します。
分割された観測空間を使用して、一般的な信念分布に対して期待される情報理論的報酬の分析限界を定式化します。
これらの境界は、パフォーマンスの保証を維持しながら効率的に計画するために使用されます。
境界が適応的で計算効率が高く、元の解に収束することを示します。
私たちはパーティション分割のパラダイムを拡張し、計画の効率を高めるパーティション分割されたスペースの階層を提示します。
次に、ガウス信念に対するこれらの限界の特定の変形を提案し、理論上のパフォーマンスが少なくとも 4 倍向上することを示します。最後に、アクティブな SLAM シナリオ、シミュレーション、実際のシナリオで、新しい方法を他の最先端のアルゴリズムと比較します。
実験。
どちらの場合も、パフォーマンスを保証しながら計画の大幅なスピードアップが見られます。

要約(オリジナル)

Decision making under uncertainty is at the heart of any autonomous system acting with imperfect information. The cost of solving the decision making problem is exponential in the action and observation spaces, thus rendering it unfeasible for many online systems. This paper introduces a novel approach to efficient decision-making, by partitioning the high-dimensional observation space. Using the partitioned observation space, we formulate analytical bounds on the expected information-theoretic reward, for general belief distributions. These bounds are then used to plan efficiently while keeping performance guarantees. We show that the bounds are adaptive, computationally efficient, and that they converge to the original solution. We extend the partitioning paradigm and present a hierarchy of partitioned spaces that allows greater efficiency in planning. We then propose a specific variant of these bounds for Gaussian beliefs and show a theoretical performance improvement of at least a factor of 4. Finally, we compare our novel method to other state of the art algorithms in active SLAM scenarios, in simulation and in real experiments. In both cases we show a significant speed-up in planning with performance guarantees.

arxiv情報

著者 Tom Yotam,Vadim Indelman
発行日 2023-09-19 15:40:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク