An Efficient End-to-End 3D Voxel Reconstruction based on Neural Architecture Search

要約

3次元物体の表現にニューラルネットワークを用いることが一般的になってきています。しかし、多くの先行研究は、異なる3Dオブジェクトを表現するために、固定されたアーキテクチャとサイズのニューラルネットワークを採用しており、単純なオブジェクトに対しては過剰なネットワークパラメータを、複雑なオブジェクトに対しては限られた再構成精度をもたらすことになる。各3次元モデルに対して、高忠実度の再構成を実現するためには、できるだけ少ないパラメータでエンドツーエンドのニューラルネットワークを構築することが望ましい。本論文では、ニューラルアーキテクチャ探索(NAS)と二値分類を利用した効率的なボクセル再構成法を提案する。層数、各層のノード数、各層の活性化関数を探索空間とし、強化学習技術に基づき、特定のネットワークアーキテクチャを得ることができる。さらに、ネットワーク推論後に使用される従来の表面再構成アルゴリズム(マーチングキューブなど)を取り除くために、2値ボクセルを分類することでエンドツーエンドネットワークを完成させる。他の符号付き距離場(SDF)予測や2値分類ネットワークと比較して、我々の方法はより少ないネットワークパラメータで有意に高い再構成精度を達成することができる。

要約(オリジナル)

Using neural networks to represent 3D objects has become popular. However, many previous works employ neural networks with fixed architecture and size to represent different 3D objects, which lead to excessive network parameters for simple objects and limited reconstruction accuracy for complex objects. For each 3D model, it is desirable to have an end-to-end neural network with as few parameters as possible to achieve high-fidelity reconstruction. In this paper, we propose an efficient voxel reconstruction method utilizing neural architecture search (NAS) and binary classification. Taking the number of layers, the number of nodes in each layer, and the activation function of each layer as the search space, a specific network architecture can be obtained based on reinforcement learning technology. Furthermore, to get rid of the traditional surface reconstruction algorithms (e.g., marching cube) used after network inference, we complete the end-to-end network by classifying binary voxels. Compared to other signed distance field (SDF) prediction or binary classification networks, our method achieves significantly higher reconstruction accuracy using fewer network parameters.

arxiv情報

著者 Yongdong Huang,Yuanzhan Li,Xulong Cao,Siyu Zhang,Shen Cai,Ting Lu,Jie Wang,Yuqi Liu
発行日 2022-08-04 14:54:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク