MELON: NeRF with Unposed Images Using Equivalence Class Estimation


ニューラル放射輝度フィールドは、少数の画像からフォトリアリスティックな品質で斬新なビューの合成とシーンの再構成を可能にしますが、既知の正確なカメラ ポーズが必要です。
ポーズ推定の主な難しさは、実際のオブジェクトが特定の変換の下でほとんど不変であり、レンダリングされたビュー間の測光距離がカメラ パラメーターに関して非凸になることにあります。
ニューラルネットワークを使用してポーズ推定を正則化することで、私たちの方法である MELON が、敵対的アプローチよりも 10 分の 1 のビューしか必要とせずに、最先端の精度で非ポーズ画像からニューラル放射輝度フィールドを再構築できることを実証します。


Neural radiance fields enable novel-view synthesis and scene reconstruction with photorealistic quality from a few images, but require known and accurate camera poses. Conventional pose estimation algorithms fail on smooth or self-similar scenes, while methods performing inverse rendering from unposed views require a rough initialization of the camera orientations. The main difficulty of pose estimation lies in real-life objects being almost invariant under certain transformations, making the photometric distance between rendered views non-convex with respect to the camera parameters. Using an equivalence relation that matches the distribution of local minima in camera space, we reduce this space to its quotient set, in which pose estimation becomes a more convex problem. Using a neural-network to regularize pose estimation, we demonstrate that our method – MELON – can reconstruct a neural radiance field from unposed images with state-of-the-art accuracy while requiring ten times fewer views than adversarial approaches.


著者 Axel Levy,Mark Matthews,Matan Sela,Gordon Wetzstein,Dmitry Lagun
発行日 2023-03-14 17:33:39+00:00
