Data Association Aware POMDP Planning with Hypothesis Pruning Performance Guarantees

要約

現実の世界で動作する自律型エージェントは、多くの場合、部分可観測性に対処する必要があります。これは、部分可観測マルコフ決定プロセス (POMDP) として一般的にモデル化されています。
ただし、従来の POMDP モデルは、完全に観測可能なデータの関連付けとして知られる、観測ソースの完全な知識の仮定に依存しています。
この制限に対処するために、各コンポーネントが異なるデータ関連付け仮説に対応する、信念混合として表される複数のデータ関連付け仮説を維持する計画アルゴリズムを提案します。
ただし、この方法では、仮説の数が指数関数的に増加する可能性があり、その結果、かなりの計算オーバーヘッドが発生します。
この課題を克服するために、あいまいなデータ関連付けを使用して計画するための剪定ベースのアプローチを導入します。
私たちの主な貢献は、仮説の完全なセットに基づく価値関数と、仮説の枝刈りされたサブセットに基づく価値関数との間の境界を導出することであり、計算効率とパフォーマンスの間のトレードオフを確立することを可能にします。
これらの境界を使用して、レトロスペクティブに剪定ヒューリスティックを証明する方法を示し、事前に定義された損失の制限を確保するためにどの仮説を剪定するかを決定する新しいアプローチを提案します。
シミュレートされた環境でアプローチを評価し、あいまいなデータの関連付けを伴うマルチモーダル信念仮説の処理におけるその有効性を示します。

要約(オリジナル)

Autonomous agents that operate in the real world must often deal with partial observability, which is commonly modeled as partially observable Markov decision processes (POMDPs). However, traditional POMDP models rely on the assumption of complete knowledge of the observation source, known as fully observable data association. To address this limitation, we propose a planning algorithm that maintains multiple data association hypotheses, represented as a belief mixture, where each component corresponds to a different data association hypothesis. However, this method can lead to an exponential growth in the number of hypotheses, resulting in significant computational overhead. To overcome this challenge, we introduce a pruning-based approach for planning with ambiguous data associations. Our key contribution is to derive bounds between the value function based on the complete set of hypotheses and the value function based on a pruned-subset of the hypotheses, enabling us to establish a trade-off between computational efficiency and performance. We demonstrate how these bounds can both be used to certify any pruning heuristic in retrospect and propose a novel approach to determine which hypotheses to prune in order to ensure a predefined limit on the loss. We evaluate our approach in simulated environments and demonstrate its efficacy in handling multi-modal belief hypotheses with ambiguous data associations.

arxiv情報

著者 Moran Barenboim,Idan Lev-Yehudi,Vadim Indelman
発行日 2023-03-30 10:08:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク