6Img-to-3D: Few-Image Large-Scale Outdoor Driving Scene Reconstruction

要約

現在の 3D 再構成技術では、少数の画像から境界のないシーンを忠実に推測するのが困難です。
具体的には、既存の方法では計算量が多く、詳細な姿勢情報が必要であり、オクルージョンされた領域を確実に再構成することができません。
シングルショット画像を 3D 再構成するための、効率的でスケーラブルなトランスフォーマーベースのエンコーダー レンダラー手法である 6Img-to-3D を紹介します。
私たちの方法では、大規模で制限のない屋外運転シナリオ向けに、わずか 6 枚の外向き入力画像から 3D 一貫性のあるパラメーター化されたトライプレーンを出力します。
トライプレーンのパラメータ化、微分可能なボリューム レンダリング、シーンの縮小、および画像特徴の投影のための契約されたカスタム クロス アテンション メカニズムとセルフ アテンション メカニズムを組み合わせることにより、既存の欠点の解決に向けて一歩を踏み出しました。
グローバルな姿勢情報を持たない単一のタイムスタンプからの 6 つのサラウンドビュー車両画像は、推論時間内に 360$^{\circ}$ のシーンを再構築するのに十分であり、395 ミリ秒かかることを示します。
私たちの方法では、たとえば、三人称画像や鳥瞰図のレンダリングが可能になります。
私たちのコードは https://github.com/continental/6Img-to-3D で入手でき、その他の例は Web サイト https://6Img-to-3D.GitHub.io/ で見つけることができます。

要約(オリジナル)

Current 3D reconstruction techniques struggle to infer unbounded scenes from a few images faithfully. Specifically, existing methods have high computational demands, require detailed pose information, and cannot reconstruct occluded regions reliably. We introduce 6Img-to-3D, an efficient, scalable transformer-based encoder-renderer method for single-shot image to 3D reconstruction. Our method outputs a 3D-consistent parameterized triplane from only six outward-facing input images for large-scale, unbounded outdoor driving scenarios. We take a step towards resolving existing shortcomings by combining contracted custom cross- and self-attention mechanisms for triplane parameterization, differentiable volume rendering, scene contraction, and image feature projection. We showcase that six surround-view vehicle images from a single timestamp without global pose information are enough to reconstruct 360$^{\circ}$ scenes during inference time, taking 395 ms. Our method allows, for example, rendering third-person images and birds-eye views. Our code is available at https://github.com/continental/6Img-to-3D, and more examples can be found at our website here https://6Img-to-3D.GitHub.io/.

arxiv情報

著者 Théo Gieruc,Marius Kästingschäfer,Sebastian Bernhard,Mathieu Salzmann
発行日 2024-04-18 17:58:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク