Laplacian Pyramid-like Autoencoder

要約

この論文では、信号処理で画像を分析するために広く使用されているラプラシアン ピラミッド (LP) の概念を追加することにより、ラプラシアン ピラミッドのようなオートエンコーダ (LPAE) を開発します。
LPAE は、画像をエンコーダ部分で近似画像と詳細画像に分解し、2 つのコンポーネントを使用してデコーダ部分で元の画像を再構成しようとします。
分類と超解像領域の実験には LPAE を使用します。
詳細画像と小さいサイズの近似画像を分類ネットワークの入力として使用することで、LPAE はモデルを軽量化します。
さらに、接続された分類ネットワークのパフォーマンスがかなり高いままであることを示します。
超解像領域では、デコーダ部分がLPの構造に似せて設定することにより、高品質の再構成画像が得られることを示します。
その結果、LPAE は、オートエンコーダーのデコーダー部分と超解像ネットワークを組み合わせることで、元の結果を改善します。

要約(オリジナル)

In this paper, we develop the Laplacian pyramid-like autoencoder (LPAE) by adding the Laplacian pyramid (LP) concept widely used to analyze images in Signal Processing. LPAE decomposes an image into the approximation image and the detail image in the encoder part and then tries to reconstruct the original image in the decoder part using the two components. We use LPAE for experiments on classifications and super-resolution areas. Using the detail image and the smaller-sized approximation image as inputs of a classification network, our LPAE makes the model lighter. Moreover, we show that the performance of the connected classification networks has remained substantially high. In a super-resolution area, we show that the decoder part gets a high-quality reconstruction image by setting to resemble the structure of LP. Consequently, LPAE improves the original results by combining the decoder part of the autoencoder and the super-resolution network.

arxiv情報

著者 Sangjun Han,Taeil Hur,Youngmi Hur
発行日 2022-08-26 07:45:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク