Research on Image Super-Resolution Reconstruction Mechanism based on Convolutional Neural Network

要約

超解像度再構成技術では、ソフトウェア アルゴリズムを使用して、同じシーンからキャプチャされた 1 つ以上の低解像度画像のセットを高解像度画像に変換します。
近年、単一画像の超解像度アルゴリズム、特に深層学習技術に基づくアルゴリズムの分野で大きな進歩が見られます。
それにもかかわらず、再構成プロセスにおける画像特徴の抽出と非線形マッピング方法は、既存のアルゴリズムにとって依然として課題です。
これらの問題により、ネットワーク アーキテクチャがさまざまなレベルで多様な情報を効果的に利用できなくなります。
高周波の詳細の損失が大きく、最終的に再構成された画像の特徴は過度に滑らかになり、細かいテクスチャの詳細が欠如しています。
これは、画像の主観的な視覚的品質に悪影響を及ぼします。
目的は、低解像度の画像から高品質、高解像度の画像を復元することです。
この研究では、強化されたディープ畳み込みニューラル ネットワーク モデルが採用されており、複数の畳み込み層で構成されており、各層は画像の多様な特徴を効果的にキャプチャするために特定のフィルターと活性化関数で構成されています。
さらに、残差学習戦略を使用してトレーニングを加速し、ネットワークの収束を強化する一方、サブピクセル畳み込み層を利用して画像の高周波の詳細とテクスチャを洗練します。
実験解析では、従来のバイキュービック内挿法や他のいくつかの学習ベースの超解像法と比較した場合、複数の公開データセット上で提案されたモデルの優れたパフォーマンスが実証されました。
さらに、画像のエッジとテクスチャを維持する際のモデルの有効性が証明されています。

要約(オリジナル)

Super-resolution reconstruction techniques entail the utilization of software algorithms to transform one or more sets of low-resolution images captured from the same scene into high-resolution images. In recent years, considerable advancement has been observed in the domain of single-image super-resolution algorithms, particularly those based on deep learning techniques. Nevertheless, the extraction of image features and nonlinear mapping methods in the reconstruction process remain challenging for existing algorithms. These issues result in the network architecture being unable to effectively utilize the diverse range of information at different levels. The loss of high-frequency details is significant, and the final reconstructed image features are overly smooth, with a lack of fine texture details. This negatively impacts the subjective visual quality of the image. The objective is to recover high-quality, high-resolution images from low-resolution images. In this work, an enhanced deep convolutional neural network model is employed, comprising multiple convolutional layers, each of which is configured with specific filters and activation functions to effectively capture the diverse features of the image. Furthermore, a residual learning strategy is employed to accelerate training and enhance the convergence of the network, while sub-pixel convolutional layers are utilized to refine the high-frequency details and textures of the image. The experimental analysis demonstrates the superior performance of the proposed model on multiple public datasets when compared with the traditional bicubic interpolation method and several other learning-based super-resolution methods. Furthermore, it proves the model’s efficacy in maintaining image edges and textures.

arxiv情報

著者 Hao Yan,Zixiang Wang,Zhengjia Xu,Zhuoyue Wang,Zhizhong Wu,Ranran Lyu
発行日 2024-08-01 03:07:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク