ViM-Disparity: Bridging the Gap of Speed, Accuracy and Memory for Disparity Map Generation

要約

この研究では、視差マップ生成 (DMG) の計算オーバーヘッドが低く、リアルタイムで正確なモデルに対する既存のトレードオフを解決するために、Visual Mamba (ViM) ベースのアーキテクチャを提案します。
さらに、推論速度、計算オーバーヘッド、DMG モデルの精度を組み合わせて評価できるパフォーマンス尺度を提案しました。
コード実装と対応するモデルは、https://github.com/MBora/ViM-Disparity から入手できます。

要約(オリジナル)

In this work we propose a Visual Mamba (ViM) based architecture, to dissolve the existing trade-off for real-time and accurate model with low computation overhead for disparity map generation (DMG). Moreover, we proposed a performance measure that can jointly evaluate the inference speed, computation overhead and the accurateness of a DMG model. The code implementation and corresponding models are available at: https://github.com/MBora/ViM-Disparity.

arxiv情報

著者 Maheswar Bora,Tushar Anand,Saurabh Atreya,Aritra Mukherjee,Abhijit Das
発行日 2025-01-10 14:40:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク