要約
深いニューラルネットワークは、高次元データ、地上オブジェクトのまばらな分布、スペクトル冗長性など、ハイパースペクトル画像分類におけるいくつかの課題に直面しています。
このホワイトペーパーでは、画像機能を導入せずに画像機能を抽出しながら、コンテキストマッピングネットワークと動的カーネル生成モジュールで構成される改善された3Dデンセネットモデルに基づいてEkGnetを提案します。
コンテキストアウェアマッピングモジュールは、ハイパースペクトル入力のグローバルなコンテキスト情報をベース畳み込みカーネルを組み合わせるための命令に変換しますが、動的カーネルは、さまざまな次元にわたって基本的なパターンに特化したKさまざまなタイプの専門家に類似した基本畳み込みのkグループで構成されます。
マッピングモジュールとダイナミックカーネル生成メカニズムは、しっかりと結合されたシステムを形成します – 前者は入力に基づいて意味のある組み合わせ重みを生成し、後者はこれらの重みを使用して適応的な専門家畳み込みシステムを構築します。
この動的なアプローチにより、モデルは、単一の静的畳み込みカーネルの固定受容フィールドに依存するのではなく、異なる領域を処理するときに、主要な空間構造により柔軟に焦点を合わせます。
Ekgnetは、ネットワークの深さや幅を増やすことなく、3Dダイナミックエキスパートの畳み込みシステムを通じてモデル表現機能を強化します。
提案された方法は、IN、UP、およびKSCデータセットの優れたパフォーマンスを示し、主流のハイパースペクトル画像分類アプローチを上回ります。
要約(オリジナル)
Deep neural networks face several challenges in hyperspectral image classification, including high-dimensional data, sparse distribution of ground objects, and spectral redundancy, which often lead to classification overfitting and limited generalization capability. To more efficiently adapt to ground object distributions while extracting image features without introducing excessive parameters and skipping redundant information, this paper proposes EKGNet based on an improved 3D-DenseNet model, consisting of a context-aware mapping network and a dynamic kernel generation module. The context-aware mapping module translates global contextual information of hyperspectral inputs into instructions for combining base convolutional kernels, while the dynamic kernels are composed of K groups of base convolutions, analogous to K different types of experts specializing in fundamental patterns across various dimensions. The mapping module and dynamic kernel generation mechanism form a tightly coupled system – the former generates meaningful combination weights based on inputs, while the latter constructs an adaptive expert convolution system using these weights. This dynamic approach enables the model to focus more flexibly on key spatial structures when processing different regions, rather than relying on the fixed receptive field of a single static convolutional kernel. EKGNet enhances model representation capability through a 3D dynamic expert convolution system without increasing network depth or width. The proposed method demonstrates superior performance on IN, UP, and KSC datasets, outperforming mainstream hyperspectral image classification approaches.
arxiv情報
著者 | Guandong Li,Mengxia Ye |
発行日 | 2025-04-17 16:00:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google