Attention Concatenation Volume for Accurate and Efficient Stereo Matching

要約

ステレオマッチングは、多くのビジョンおよびロボット工学アプリケーションの基本的な構成要素です。
有益で簡潔なコストボリューム表現は、高精度と効率のステレオマッチングに不可欠です。
本論文では、相関手がかりから注意の重みを生成し、冗長な情報を抑制し、連結ボリューム内のマッチング関連情報を強化する、新しいコストボリューム構築方法を提示します。
信頼できる注意の重みを生成するために、マルチレベルの適応パッチマッチングを提案して、テクスチャのない領域でもさまざまな視差でのマッチングコストの識別性を向上させます。
提案されたコストボリュームは、ほとんどのステレオマッチングネットワークにシームレスに埋め込むことができるアテンション連結ボリューム(ACV)と呼ばれ、結果として得られるネットワークは、より軽量な集約ネットワークを使用できると同時に、より高い精度を実現できます。
アグリゲーションネットワークの1/25パラメータのみを使用すると、GwcNetの精度を高めることができます。
さらに、ACVに基づいて高精度ネットワーク(ACVNet)を設計し、いくつかのベンチマークで最先端のパフォーマンスを実現します。

要約(オリジナル)

Stereo matching is a fundamental building block for many vision and robotics applications. An informative and concise cost volume representation is vital for stereo matching of high accuracy and efficiency. In this paper, we present a novel cost volume construction method which generates attention weights from correlation clues to suppress redundant information and enhance matching-related information in the concatenation volume. To generate reliable attention weights, we propose multi-level adaptive patch matching to improve the distinctiveness of the matching cost at different disparities even for textureless regions. The proposed cost volume is named attention concatenation volume (ACV) which can be seamlessly embedded into most stereo matching networks, the resulting networks can use a more lightweight aggregation network and meanwhile achieve higher accuracy, e.g. using only 1/25 parameters of the aggregation network can achieve higher accuracy for GwcNet. Furthermore, we design a highly accurate network (ACVNet) based on our ACV, which achieves state-of-the-art performance on several benchmarks.

arxiv情報

著者 Gangwei Xu,Junda Cheng,Peng Guo,Xin Yang
発行日 2022-06-23 14:46:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク