Orthogonal Transform based Generative Adversarial Network for Image Dehazing

要約

画像の曇り除去は、コンピュータビジョンタスクの重要な前処理ステップの1つになっています。
ほとんどのデヘイズ方法は、画像領域でデヘイズされた画像を取得するために、大気光とともに透過マップを推定しようとします。
この論文では、Krawtchouk変換ドメインでデヘイズされた画像を直接推定する新しいエンドツーエンドアーキテクチャを提案します。
このために、アーキテクチャにカスタマイズされたKrawtchouk畳み込み層(KCL)が追加されます。
KCLは、画像を空間ドメインからKrawtchouk変換ドメインに変換するKrawtchouk基底関数を使用して構築されます。
アーキテクチャの最後に、Inverse Krawtchouk Convolution Layer(IKCL)という名前の別の畳み込みレイヤーが追加されます。これは、画像を変換ドメインから空間ドメインに変換し直します。
ヘイズは主に低周波数のかすんでいる画像に存在することが観察されており、Krawtchouk変換は画像の高周波数と低周波数を別々に分析するのに役立ちます。
アーキテクチャを2つのブランチに分割しました。上のブランチはより高い周波数を扱い、下のブランチは画像のより低い周波数を扱います。
下のブランチは、上のブランチと比較してレイヤーの点で深くなり、低周波数に存在するヘイズに対処します。
画像の曇り除去に提案された直交変換ベースの生成的敵対的ネットワーク(OTGAN)アーキテクチャを使用して、現在の最先端の方法と比較した場合、競争力のある結果を達成することができました。

要約(オリジナル)

Image dehazing has become one of the crucial preprocessing steps for any computer vision task. Most of the dehazing methods try to estimate the transmission map along with the atmospheric light to get the dehazed image in the image domain. In this paper, we propose a novel end-to-end architecture that directly estimates dehazed image in Krawtchouk transform domain. For this a customized Krawtchouk Convolution Layer (KCL) in the architecture is added. KCL is constructed using Krawtchouk basis functions which converts the image from the spatial domain to the Krawtchouk transform domain. Another convolution layer is added at the end of the architecture named as Inverse Krawtchouk Convolution Layer (IKCL) which converts the image back to the spatial domain from the transform domain. It has been observed that the haze is mainly present in lower frequencies of hazy images, wherein the Krawtchouk transform helps to analyze the high and low frequencies of the images separately. We have divided our architecture into two branches, the upper branch deals with the higher frequencies while the lower branch deals with the lower frequencies of the image. The lower branch is made deeper in terms of the layers as compared to the upper branch to address the haze present in the lower frequencies. Using the proposed Orthogonal Transform based Generative Adversarial Network (OTGAN) architecture for image dehazing, we were able to achieve competitive results when compared to the present state-of-the-art methods.

arxiv情報

著者 Ahlad Kumar,Mantra Sanathra,Manish Khare,Vijeta Khare
発行日 2022-06-03 08:17:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク