要約
このペーパーでは、従来のキーポイントベースのカメラポーズ最適化と可逆ニューラルレンダリングメカニズムを組み合わせたフレームワークを紹介します。
私たちが提案する3Dシーン表現であるNerfelsは、局所的に密集していますが、全体的にまばらです。
モデルをシーン全体にオーバーフィットする既存の可逆ニューラルレンダリングシステムとは対照的に、レンダリング可能なコードを使用して、シーンに依存しないローカル3Dパッチを表現するための機能駆動型アプローチを採用しています。
ローカルフィーチャが検出された場所でのみシーンをモデル化することにより、フレームワークは、スパース3Dマップ表現の低メモリフットプリントを維持しながら、ニューラルレンダラーの最適化可能なコードコンディショニングメカニズムを介して、シーン内の見えないローカル領域に効果的に一般化します。
私たちのモデルは、既存の最先端の手作りで学習されたローカル特徴ポーズ推定器に組み込むことができ、ワイドカメラベースラインシナリオのScanNetで評価する際のパフォーマンスが向上します。
要約(オリジナル)
This paper presents a framework that combines traditional keypoint-based camera pose optimization with an invertible neural rendering mechanism. Our proposed 3D scene representation, Nerfels, is locally dense yet globally sparse. As opposed to existing invertible neural rendering systems which overfit a model to the entire scene, we adopt a feature-driven approach for representing scene-agnostic, local 3D patches with renderable codes. By modelling a scene only where local features are detected, our framework effectively generalizes to unseen local regions in the scene via an optimizable code conditioning mechanism in the neural renderer, all while maintaining the low memory footprint of a sparse 3D map representation. Our model can be incorporated to existing state-of-the-art hand-crafted and learned local feature pose estimators, yielding improved performance when evaluating on ScanNet for wide camera baseline scenarios.
arxiv情報
著者 | Gil Avraham,Julian Straub,Tianwei Shen,Tsun-Yi Yang,Hugo Germain,Chris Sweeney,Vasileios Balntas,David Novotny,Daniel DeTone,Richard Newcombe |
発行日 | 2022-06-04 06:29:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google