要約
この研究では、視差マップ生成 (DMG) の計算オーバーヘッドが低く、リアルタイムで正確なモデルに対する既存のトレードオフを解決するために、Visual Mamba (ViM) ベースのアーキテクチャを提案します。
さらに、推論速度、計算オーバーヘッド、DMG モデルの精度を組み合わせて評価できるパフォーマンス尺度を提案しました。
コード実装と対応するモデルは、https://github.com/MBora/ViM-Disparity から入手できます。
要約(オリジナル)
In this work we propose a Visual Mamba (ViM) based architecture, to dissolve the existing trade-off for real-time and accurate model with low computation overhead for disparity map generation (DMG). Moreover, we proposed a performance measure that can jointly evaluate the inference speed, computation overhead and the accurateness of a DMG model. The code implementation and corresponding models are available at: https://github.com/MBora/ViM-Disparity.
arxiv情報
著者 | Maheswar Bora,Tushar Anand,Saurabh Atreya,Aritra Mukherjee,Abhijit Das |
発行日 | 2025-01-10 14:40:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google