要約
現実世界で動作する自律エージェントは、多くの場合、部分可観測性を処理する必要があります。部分可観測性は、一般に部分可観測マルコフ決定プロセス (POMDP) としてモデル化されます。
ただし、従来の POMDP モデルは、完全に観測可能なデータの関連付けとして知られる、観測ソースの完全な知識の前提に依存しています。
この制限に対処するために、我々は、各コンポーネントが異なるデータ関連仮説に対応する、信念混合として表される複数のデータ関連仮説を維持する計画アルゴリズムを提案します。
ただし、この方法では仮説の数が指数関数的に増加し、大幅な計算オーバーヘッドが発生する可能性があります。
この課題を克服するために、あいまいなデータの関連付けを計画するためのプルーニング ベースのアプローチを導入します。
私たちの主な貢献は、仮説の完全なセットに基づく価値関数と仮説の枝刈りされたサブセットに基づく価値関数の間の境界を導出し、計算効率とパフォーマンスの間のトレードオフを確立できるようにすることです。
私たちは、これらの境界を使用して、遡及的に枝刈りヒューリスティックを証明する方法と、事前に定義された損失の制限を確保するためにどの仮説を枝刈りするかを決定するための新しいアプローチを提案する方法を示します。
私たちはシミュレーション環境でアプローチを評価し、データの関連性が曖昧なマルチモーダル信念仮説の処理におけるその有効性を実証します。
要約(オリジナル)
Autonomous agents that operate in the real world must often deal with partial observability, which is commonly modeled as partially observable Markov decision processes (POMDPs). However, traditional POMDP models rely on the assumption of complete knowledge of the observation source, known as fully observable data association. To address this limitation, we propose a planning algorithm that maintains multiple data association hypotheses, represented as a belief mixture, where each component corresponds to a different data association hypothesis. However, this method can lead to an exponential growth in the number of hypotheses, resulting in significant computational overhead. To overcome this challenge, we introduce a pruning-based approach for planning with ambiguous data associations. Our key contribution is to derive bounds between the value function based on the complete set of hypotheses and the value function based on a pruned-subset of the hypotheses, enabling us to establish a trade-off between computational efficiency and performance. We demonstrate how these bounds can both be used to certify any pruning heuristic in retrospect and propose a novel approach to determine which hypotheses to prune in order to ensure a predefined limit on the loss. We evaluate our approach in simulated environments and demonstrate its efficacy in handling multi-modal belief hypotheses with ambiguous data associations.
arxiv情報
著者 | Moran Barenboim,Idan Lev-Yehudi,Vadim Indelman |
発行日 | 2023-08-01 18:41:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google