Bayesian Learning for Disparity Map Refinement for Semi-Dense Active Stereo Vision


ステレオ ビジョンにおける最近の開発の主な焦点は、パッシブ ステレオ ビジョンで正確な高密度の視差マップを取得する方法にあります。
アクティブ ビジョン システムは、パッシブ ステレオと比較して、高密度の視差をより正確に推定できます。
重要な洞察は、視差推定を修正するのに十分な情報がないピクセルを無効にしながら、視差マップを改良する方法を共同で学習できる場合、ニューラル ネットワークの精度を 2 倍にできるということです。
Active-Passive SimStereo などのアクティブ ステレオ データセットを使用して、提案された方法が現在の最先端のアクティブ ステレオ モデルよりも優れていることを示します。
また、提案されたアプローチが、Middlebury データセットの最先端のパッシブ ステレオ モデルと比較して優れていることも示しています。


A major focus of recent developments in stereo vision has been on how to obtain accurate dense disparity maps in passive stereo vision. Active vision systems enable more accurate estimations of dense disparity compared to passive stereo. However, subpixel-accurate disparity estimation remains an open problem that has received little attention. In this paper, we propose a new learning strategy to train neural networks to estimate high-quality subpixel disparity maps for semi-dense active stereo vision. The key insight is that neural networks can double their accuracy if they are able to jointly learn how to refine the disparity map while invalidating the pixels where there is insufficient information to correct the disparity estimate. Our approach is based on Bayesian modeling where validated and invalidated pixels are defined by their stochastic properties, allowing the model to learn how to choose by itself which pixels are worth its attention. Using active stereo datasets such as Active-Passive SimStereo, we demonstrate that the proposed method outperforms the current state-of-the-art active stereo models. We also demonstrate that the proposed approach compares favorably with state-of-the-art passive stereo models on the Middlebury dataset.


著者 Laurent Valentin Jospin,Hamid Laga,Farid Boussaid,Mohammed Bennamoun
発行日 2022-09-12 08:33:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク