Safe POMDP Online Planning among Dynamic Agents via Adaptive Conformal Prediction

要約

部分的に観察可能なマルコフ意思決定プロセス (POMDP) のオンライン計画は、不確実性の下でのロボットの意思決定のための効率的な手法を提供します。
しかし、既存の方法では、動的な環境における安全違反を防ぐには不十分です。
この研究では、複数の動的エージェントが存在する環境の中で確率論的な安全性を保証する、新しい安全な POMDP オンライン プランニング アプローチを提示します。
私たちのアプローチは、動的エージェントのデータ駆動型軌道予測モデルを利用し、これらの予測の不確実性を評価するために適応等角予測 (ACP) を適用します。
取得した ACP ベースの軌道予測を活用する私たちのアプローチは、POMDP オンライン計画内での危険な行動を防ぐために、その場で安全シールドを構築します。
実際の歩行者の軌跡データを使用したさまざまな動的環境での実験的評価を通じて、提案されたアプローチは、最大数百の動的エージェントに対応しながら、確率論的な安全保証を効果的に維持することが示されました。

要約(オリジナル)

Online planning for partially observable Markov decision processes (POMDPs) provides efficient techniques for robot decision-making under uncertainty. However, existing methods fall short of preventing safety violations in dynamic environments. This work presents a novel safe POMDP online planning approach that offers probabilistic safety guarantees amidst environments populated by multiple dynamic agents. Our approach utilizes data-driven trajectory prediction models of dynamic agents and applies Adaptive Conformal Prediction (ACP) for assessing the uncertainties in these predictions. Leveraging the obtained ACP-based trajectory predictions, our approach constructs safety shields on-the-fly to prevent unsafe actions within POMDP online planning. Through experimental evaluation in various dynamic environments using real-world pedestrian trajectory data, the proposed approach has been shown to effectively maintain probabilistic safety guarantees while accommodating up to hundreds of dynamic agents.

arxiv情報

著者 Shili Sheng,Pian Yu,David Parker,Marta Kwiatkowska,Lu Feng
発行日 2024-04-23 23:11:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク