要約
この論文では、デジタル画像の品質を向上させることができる低照度画像強調の自動方法であるTreEnhanceを紹介します。
この方法は、ツリー探索理論、特にモンテカルロ ツリー探索 (MCTS) アルゴリズムと深層強化学習を組み合わせたものです。
低照度画像を入力として与えられると、TreEnhance は、それを取得するために使用される一連の画像編集操作と共に、その強化されたバージョンを出力として生成します。
トレーニング段階では、この方法は 2 つの主要な段階を繰り返し交互に繰り返します。生成段階では、MCTS の修正版が画像編集操作の空間を探索し、最も有望なシーケンスを選択します。最適化段階では、ニューラル ネットワークのパラメーターが、
強化ポリシーの実装、更新されます。
新しい画像を強化するために、2 つの異なる推論ソリューションが提案されています。
もう 1 つは、学習したポリシーを直接適用するもので、速度は速くなりますが、精度はわずかに劣ります。
さらなる貢献として、写真編集者が特定の入力画像に適用した強調手順を「逆にする」ガイド付き検索戦略を提案します。
最先端の他の方法とは異なり、TreEnhance は画像の解像度に制約を課さず、最小限の調整でさまざまなシナリオで使用できます。
ローライト データセットと Adobe Five-K データセットの 2 つのデータセットでこの方法をテストし、質的観点と定量的観点の両方から良好な結果を得ました。
要約(オリジナル)
In this paper we present TreEnhance, an automatic method for low-light image enhancement capable of improving the quality of digital images. The method combines tree search theory, and in particular the Monte Carlo Tree Search (MCTS) algorithm, with deep reinforcement learning. Given as input a low-light image, TreEnhance produces as output its enhanced version together with the sequence of image editing operations used to obtain it. During the training phase, the method repeatedly alternates two main phases: a generation phase, where a modified version of MCTS explores the space of image editing operations and selects the most promising sequence, and an optimization phase, where the parameters of a neural network, implementing the enhancement policy, are updated. Two different inference solutions are proposed for the enhancement of new images: one is based on MCTS and is more accurate but more time and memory consuming; the other directly applies the learned policy and is faster but slightly less precise. As a further contribution, we propose a guided search strategy that ‘reverses’ the enhancement procedure that a photo editor applied to a given input image. Unlike other methods from the state of the art, TreEnhance does not pose any constraint on the image resolution and can be used in a variety of scenarios with minimal tuning. We tested the method on two datasets: the Low-Light dataset and the Adobe Five-K dataset obtaining good results from both a qualitative and a quantitative point of view.
arxiv情報
著者 | Marco Cotogni,Claudio Cusano |
発行日 | 2022-12-14 16:01:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google