要約
ロボットの知覚は現在、効率的な潜在空間で動作する現代的な手法と、数学的に確立され、解釈可能で信頼できる結果を提供する古典的な手法の間の岐路に立っています。
この論文では、深さ方向に分離可能な畳み込み層内で明示的ベイジアン推論を実行することを学習して、信頼性を同時に維持しながら効率を最大化する畳み込みベイジアン カーネル推論 (ConvBKI) 層を紹介します。
このレイヤーをリアルタイム 3D セマンティック マッピングのタスクに適用します。そこでは、LiDAR センサー情報のセマンティック幾何学的確率分布を学習し、セマンティック予測をグローバル マップに組み込みます。
私たちは、KITTI データセット上の最先端のセマンティック マッピング アルゴリズムに対してネットワークを評価し、同等のセマンティック ラベル推論結果でレイテンシーの改善を実証しています。
要約(オリジナル)
Robotic perception is currently at a cross-roads between modern methods, which operate in an efficient latent space, and classical methods, which are mathematically founded and provide interpretable, trustworthy results. In this paper, we introduce a Convolutional Bayesian Kernel Inference (ConvBKI) layer which learns to perform explicit Bayesian inference within a depthwise separable convolution layer to maximize efficency while maintaining reliability simultaneously. We apply our layer to the task of real-time 3D semantic mapping, where we learn semantic-geometric probability distributions for LiDAR sensor information and incorporate semantic predictions into a global map. We evaluate our network against state-of-the-art semantic mapping algorithms on the KITTI data set, demonstrating improved latency with comparable semantic label inference results.
arxiv情報
著者 | Joey Wilson,Yuewei Fu,Arthur Zhang,Jingyu Song,Andrew Capodieci,Paramsothy Jayakumar,Kira Barton,Maani Ghaffari |
発行日 | 2023-05-31 19:41:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google