PRISM: Probabilistic Real-Time Inference in Spatial World Models

要約

我々は、エージェントの運動と視覚的知覚の確率的生成モデルにおけるリアルタイムフィルタリングのための手法であるPRISMを紹介する。これまでのアプローチは、マップとエージェントの状態に対する不確実性推定がない、リアルタイムで実行されない、密なシーン表現がない、エージェントのダイナミクスをモデル化していない、のいずれかである。我々のソリューションはこれら全ての側面を調和させる。我々は微分可能なレンダリングと6-DoFダイナミクスを組み合わせた事前定義された状態空間モデルからスタートする。このモデルにおける確率的推論は、SLAM(Simultaneous Localisation and Mapping)に相当し、実行不可能である。我々は、ベイズ推定に近似した一連の手法を用い、確率的な地図と状態の推定を行う。確立された手法と閉形式の更新を利用することで、精度を保ちつつ、リアルタイム性を実現します。提案するソリューションは10Hzのリアルタイムで動作し、高速UAVと携帯カメラエージェント(Blackbird、EuRoC、TUM-RGBD)を用いて、中小規模の屋内環境で最先端のSLAMと同様の精度を実現することが可能です。

要約(オリジナル)

We introduce PRISM, a method for real-time filtering in a probabilistic generative model of agent motion and visual perception. Previous approaches either lack uncertainty estimates for the map and agent state, do not run in real-time, do not have a dense scene representation or do not model agent dynamics. Our solution reconciles all of these aspects. We start from a predefined state-space model which combines differentiable rendering and 6-DoF dynamics. Probabilistic inference in this model amounts to simultaneous localisation and mapping (SLAM) and is intractable. We use a series of approximations to Bayesian inference to arrive at probabilistic map and state estimates. We take advantage of well-established methods and closed-form updates, preserving accuracy and enabling real-time capability. The proposed solution runs at 10Hz real-time and is similarly accurate to state-of-the-art SLAM in small to medium-sized indoor environments, with high-speed UAV and handheld camera agents (Blackbird, EuRoC and TUM-RGBD).

arxiv情報

著者 Atanas Mirchev,Baris Kayalibay,Ahmed Agha,Patrick van der Smagt,Daniel Cremers,Justin Bayer
発行日 2022-12-06 13:59:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG, cs.RO, stat.ML パーマリンク