要約
シーン照度から画像強度へのマッピングをモデル化することは、多くのコンピュータビジョンのタスクに不可欠である。このようなマッピングは、カメラ応答として知られている。ほとんどのデジタルカメラでは、センサーで測定された放射照度を、写真を記録するための画像強度にマッピングするために非線形関数を使用しています。非線形校正のためには、カメラ応答のモデリングが必要である。本論文では、単一の潜在変数と完全連結ニューラルネットワークを用いた新しい高性能カメラ応答モデルを提案する。このモデルは、実世界(例)のカメラ応答に対してオートエンコーダーを用いた教師なし学習を用いて生成される。そして、最適なニューラルネットワークアーキテクチャを見つけるために、ニューラルネットワークアーキテクチャ探索が使用される。潜在分布を制約するために、潜在分布学習アプローチが導入された。提案モデルは、多くのベンチマークテストにおいて、最先端のCRF表現精度を達成したが、シンプルかつ効率的なモデル表現により、カメラ応答校正時の最尤推定を行う際に、現行の最高モデルに比べて約2倍の高速化を達成した。
要約(オリジナル)
Modelling the mapping from scene irradiance to image intensity is essential for many computer vision tasks. Such mapping is known as the camera response. Most digital cameras use a nonlinear function to map irradiance, as measured by the sensor to an image intensity used to record the photograph. Modelling of the response is necessary for the nonlinear calibration. In this paper, a new high-performance camera response model that uses a single latent variable and fully connected neural network is proposed. The model is produced using unsupervised learning with an autoencoder on real-world (example) camera responses. Neural architecture searching is then used to find the optimal neural network architecture. A latent distribution learning approach was introduced to constrain the latent distribution. The proposed model achieved state-of-the-art CRF representation accuracy in a number of benchmark tests, but is almost twice as fast as the best current models when performing the maximum likelihood estimation during camera response calibration due to the simple yet efficient model representation.
arxiv情報
著者 | Yunfeng Zhao,Stuart Ferguson,Huiyu Zhou,Karen Rafferty |
発行日 | 2022-09-08 08:02:57+00:00 |
arxivサイト | arxiv_id(pdf) |