DGCNet: An Efficient 3D-Densenet based on Dynamic Group Convolution for Hyperspectral Remote Sensing Image Classification

要約

ディープ ニューラル ネットワークは、モデルの深さが増すにつれて、ハイパースペクトル画像分類、空間スペクトル情報の効果的な利用の欠如、勾配の消失、および過学習の分野で多くの問題に直面します。
厳格なレイテンシ要件と限られたコンピューティング能力を持つエッジ デバイスへのモデルの展開を加速するために、改良された 3D-Densenet モデルと設計 DGCNet に基づく軽量モデルを導入します。
グループ畳み込みの欠点を改善します。
ダイナミックネットワークの考え方を参考にして、ダイナミックグループコンボリューション(DGC)は3Dコンボリューションカーネル上に設計されています。
DGC では、グループごとに小さな機能セレクターを導入し、すべての入力チャンネルのアクティブ化に基づいて入力チャンネルのどの部分を接続するかを動的に決定します。
複数のグループが入力画像の異なる相補的な視覚的および意味的特徴をキャプチャできるため、畳み込みニューラル ネットワーク (CNN) が豊富な特徴を学習できるようになります。
3D コンボリューションは高次元で冗長なハイパースペクトル データを抽出します。また、コンボリューション カーネル間には多くの冗長な情報が存在します。
DGC モジュールを使用すると、3D-Densenet がより豊富なセマンティック機能を備えたチャネル情報を選択し、非アクティブな領域を破棄できるようになります。
DGC モジュールを通過する 3D-CNN は、枝刈りされたネットワークとみなすことができます。
DGC では、3D-CNN で十分な特徴抽出が行えるだけでなく、速度や計算量の要件も考慮されています。
推論の速度と精度が向上し、IN、Pavia、KSC データセット上で主流のハイパースペクトル画像分類法に先駆けて優れたパフォーマンスを発揮します。

要約(オリジナル)

Deep neural networks face many problems in the field of hyperspectral image classification, lack of effective utilization of spatial spectral information, gradient disappearance and overfitting as the model depth increases. In order to accelerate the deployment of the model on edge devices with strict latency requirements and limited computing power, we introduce a lightweight model based on the improved 3D-Densenet model and designs DGCNet. It improves the disadvantage of group convolution. Referring to the idea of dynamic network, dynamic group convolution(DGC) is designed on 3d convolution kernel. DGC introduces small feature selectors for each grouping to dynamically decide which part of the input channel to connect based on the activations of all input channels. Multiple groups can capture different and complementary visual and semantic features of input images, allowing convolution neural network(CNN) to learn rich features. 3D convolution extracts high-dimensional and redundant hyperspectral data, and there is also a lot of redundant information between convolution kernels. DGC module allows 3D-Densenet to select channel information with richer semantic features and discard inactive regions. The 3D-CNN passing through the DGC module can be regarded as a pruned network. DGC not only allows 3D-CNN to complete sufficient feature extraction, but also takes into account the requirements of speed and calculation amount. The inference speed and accuracy have been improved, with outstanding performance on the IN, Pavia and KSC datasets, ahead of the mainstream hyperspectral image classification methods.

arxiv情報

著者 Guandong Li
発行日 2023-07-13 10:19:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク