Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

要約

マルチビュー3D再構成は、特に多様な視点で正確でスケーラブルな表現を必要とするアプリケーションで、コンピュータービジョンの中心的な課題のままです。
Dust3Rなどの現在の主要な方法は、根本的にペアワイズアプローチを採用し、画像をペアで処理し、複数のビューから再構築するための費用のかかるグローバルアライメント手順を必要とします。
この作業では、多くのビューを並行して処理することにより効率的でスケーラブルな3D再構成を達成するDust3Rへの新しいマルチビューの一般化である高速3D再構成(FAST3R)を提案します。
Fast3Rの変圧器ベースのアーキテクチャは、単一のフォワードパスでn画像を転送し、反復アライメントの必要性を回避します。
カメラの推定値と3D再構成に関する広範な実験を通じて、Fast3Rは最先端のパフォーマンスを示し、推論速度が大幅に改善され、誤差蓄積が減少します。
これらの結果は、Multi-Viewアプリケーションの堅牢な代替品としてFast3Rを確立し、再構成の精度を損なうことなくスケーラビリティを向上させます。

要約(オリジナル)

Multi-view 3D reconstruction remains a core challenge in computer vision, particularly in applications requiring accurate and scalable representations across diverse perspectives. Current leading methods such as DUSt3R employ a fundamentally pairwise approach, processing images in pairs and necessitating costly global alignment procedures to reconstruct from multiple views. In this work, we propose Fast 3D Reconstruction (Fast3R), a novel multi-view generalization to DUSt3R that achieves efficient and scalable 3D reconstruction by processing many views in parallel. Fast3R’s Transformer-based architecture forwards N images in a single forward pass, bypassing the need for iterative alignment. Through extensive experiments on camera pose estimation and 3D reconstruction, Fast3R demonstrates state-of-the-art performance, with significant improvements in inference speed and reduced error accumulation. These results establish Fast3R as a robust alternative for multi-view applications, offering enhanced scalability without compromising reconstruction accuracy.

arxiv情報

著者 Jianing Yang,Alexander Sax,Kevin J. Liang,Mikael Henaff,Hao Tang,Ang Cao,Joyce Chai,Franziska Meier,Matt Feiszli
発行日 2025-01-23 18:59:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO パーマリンク