要約
ハイパースペクトル画像 (HSI) 分類は、大規模な地球監視システムを構築するためのリモート センシングにとって重要な技術です。
HSI には、土地被覆のカテゴリーを識別するための従来の視覚画像よりもはるかに多くの情報が含まれています。
HSI に対する最近の実現可能なソリューションの 1 つは、スペクトル空間情報をキャプチャするために CapsNet を活用することです。
ただし、これらの方法では、積み重ねられたカプセル層間の完全な接続アーキテクチャにより、高い計算要件が必要になります。
この問題を解決するために、効果的かつ効率的な HSI 分類のために CapsNet 内の部分的だが重要な接続を識別する DWT-CapsNet が提案されています。
具体的には、テイラード アテンション メカニズムを離散ウェーブレット変換 (DWT) ベースのダウンサンプリング レイヤーに統合し、特徴抽出器における従来のダウンサンプリング操作の情報損失の問題を軽減します。
さらに、CapsNet 内の接続の大部分をプルーニングする新しいマルチスケール ルーティング アルゴリズムを提案します。
カプセル ピラミッド フュージョン メカニズムは、複数レベルの粒度でスペクトルと空間の関係を集約するように設計されており、その後、意味のある関係を強調するために、部分的および局所的に接続されたアーキテクチャでセルフ アテンション メカニズムがさらに実行されます。
実験結果に示されているように、私たちの方法は実行時間、フロップ、パラメータ数に関する計算需要を低く抑えながら最先端の精度を達成しており、HSI 分類での実用的な実装にとって魅力的な選択肢となっています。
要約(オリジナル)
Hyperspectral image (HSI) classification is a crucial technique for remote sensing to build large-scale earth monitoring systems. HSI contains much more information than traditional visual images for identifying the categories of land covers. One recent feasible solution for HSI is to leverage CapsNets for capturing spectral-spatial information. However, these methods require high computational requirements due to the full connection architecture between stacked capsule layers. To solve this problem, a DWT-CapsNet is proposed to identify partial but important connections in CapsNet for a effective and efficient HSI classification. Specifically, we integrate a tailored attention mechanism into a Discrete Wavelet Transform (DWT)-based downsampling layer, alleviating the information loss problem of conventional downsampling operation in feature extractors. Moreover, we propose a novel multi-scale routing algorithm that prunes a large proportion of connections in CapsNet. A capsule pyramid fusion mechanism is designed to aggregate the spectral-spatial relationships in multiple levels of granularity, and then a self-attention mechanism is further conducted in a partially and locally connected architecture to emphasize the meaningful relationships. As shown in the experimental results, our method achieves state-of-the-art accuracy while keeping lower computational demand regarding running time, flops, and the number of parameters, rendering it an appealing choice for practical implementation in HSI classification.
arxiv情報
著者 | Zhiqiang Gao,Jiaqi Wang,Hangchi Shen,Zhihao Dou,Xiangbo Zhang,Kaizhu Huang |
発行日 | 2025-01-08 17:49:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google