要約
耕地の非農業化とは、耕地を森林、住宅地、建設地などの非農業的用途に転換することを指す。この現象は、耕地資源の喪失に直接つながるだけでなく、食料安全保障と農業の持続可能性に対する体系的な脅威となる。耕作地と非耕作地を正確に識別することは、この問題を検出し対処するために極めて重要である。従来のCNNは静的畳み込み層を採用しているが、動的畳み込みの研究では、注意メカニズムによって複数の畳み込みカーネルを適応的に重み付けすることで、精度を向上できることが実証されている。しかし、既存の動的畳み込み法では、注意の重み付けをグローバル平均プーリング(GAP)に依存しているため、情報損失に苦しみ、セグメンテーションの精度が制限される。本論文では、これらの限界に対処するために、周波数考慮ダイナミックコンボリューション(FADConv)と周波数アテンション(FAT)モジュールを提案する。ダイナミックコンボリューションの基礎構造を基に、周波数領域の特徴を捉え、それらを融合するために2次元離散コサイン変換(2D DCT)を統合することでFADConvを設計した。FATモジュールは、従来のGAP法に代わる高品質の注目重みを生成し、動的畳み込みカーネル間の組み合わせをより合理的にする。GIDとHi-CNAデータセットでの実験により、FADConvが最小限の計算オーバーヘッドでセグメンテーション精度を大幅に改善することが実証された。例えば、FADConvを用いたResNet18は、GIDの農地のセグメンテーションにおいて、F1スコアとIoUで1.9%と2.7%の増加を達成し、追加MAddsは58.87Mだけである。他のダイナミックコンボリューションアプローチと比較して、FADConvは農地セグメンテーションタスクにおいて優れた性能を示す。
要約(オリジナル)
Cropland non-agriculturalization refers to the conversion of arable land into non-agricultural uses such as forests, residential areas, and construction sites. This phenomenon not only directly leads to the loss of cropland resources but also poses systemic threats to food security and agricultural sustainability. Accurate identification of cropland and non-cropland areas is crucial for detecting and addressing this issue. Traditional CNNs employ static convolution layers, while dynamic convolution studies demonstrate that adaptively weighting multiple convolutional kernels through attention mechanisms can enhance accuracy. However, existing dynamic convolution methods relying on Global Average Pooling (GAP) for attention weight allocation suffer from information loss, limiting segmentation precision. This paper proposes Frequency-Aware Dynamic Convolution (FADConv) and a Frequency Attention (FAT) module to address these limitations. Building upon the foundational structure of dynamic convolution, we designed FADConv by integrating 2D Discrete Cosine Transform (2D DCT) to capture frequency domain features and fuse them. FAT module generates high-quality attention weights that replace the traditional GAP method,making the combination between dynamic convolution kernels more reasonable.Experiments on the GID and Hi-CNA datasets demonstrate that FADConv significantly improves segmentation accuracy with minimal computational overhead. For instance, ResNet18 with FADConv achieves 1.9% and 2.7% increases in F1-score and IoU for cropland segmentation on GID, with only 58.87M additional MAdds. Compared to other dynamic convolution approaches, FADConv exhibits superior performance in cropland segmentation tasks.
arxiv情報
著者 | Tan Shu,Li Shen |
発行日 | 2025-04-04 15:13:37+00:00 |
arxivサイト | arxiv_id(pdf) |