LR-Net: A Block-based Convolutional Neural Network for Low-Resolution Image Classification

要約

画像分類におけるCNNベースのアーキテクチャは、学習と特徴抽出の成功により、最近とても人気がありますが、ノイジーで低品質な画像の分類に最新モデルを適用すると、画像分類のタスクはより困難になります。この種の画像は解像度が低く、意味のあるグローバルな特徴がないため、モデルにとって意味のある特徴を抽出することはまだ困難です。さらに、高解像度画像はより多くのレイヤーを学習する必要があるため、学習時間と計算能力がより多く必要になります。また、先に述べたディープニューラルネットワークでは、層が深くなるにつれて勾配が消失するという問題がありますが、本手法ではその問題にも対応しています。これらの問題に対処するため、我々は、ぼやけた低解像度の画像やノイズの多い画像から低レベルとグローバルな特徴を学習するためのブロックからなる、新しい画像分類アーキテクチャを開発しました。ブロックの設計は、性能向上とパラメータサイズ削減のため、Residual ConnectionsとInceptionモジュールに大きく影響された。また、MNISTファミリーのデータセットを用いて我々の研究を評価し、特に低画質でノイズの多い画像のため分類が最も難しいOracle-MNISTデータセットに重点を置いている。私たちは綿密なテストを行い、今回発表したアーキテクチャが既存の最先端の畳み込みニューラルネットワークよりも高速かつ高精度であることを実証しました。さらに、我々のモデルのユニークな特性により、より少ないパラメータでより良い結果を出すことができる。

要約(オリジナル)

The success of CNN-based architecture on image classification in learning and extracting features made them so popular these days, but the task of image classification becomes more challenging when we apply state of art models to classify noisy and low-quality images. It is still difficult for models to extract meaningful features from this type of image due to its low-resolution and the lack of meaningful global features. Moreover, high-resolution images need more layers to train which means they take more time and computational power to train. Our method also addresses the problem of vanishing gradients as the layers become deeper in deep neural networks that we mentioned earlier. In order to address all these issues, we developed a novel image classification architecture, composed of blocks that are designed to learn both low level and global features from blurred and noisy low-resolution images. Our design of the blocks was heavily influenced by Residual Connections and Inception modules in order to increase performance and reduce parameter sizes. We also assess our work using the MNIST family datasets, with a particular emphasis on the Oracle-MNIST dataset, which is the most difficult to classify due to its low-quality and noisy images. We have performed in-depth tests that demonstrate the presented architecture is faster and more accurate than existing cutting-edge convolutional neural networks. Furthermore, due to the unique properties of our model, it can produce a better result with fewer parameters.

arxiv情報

著者 Ashkan Ganj,Mohsen Ebadpour,Mahdi Darvish,Hamid Bahador
発行日 2022-08-11 10:59:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, I.4.0 パーマリンク