要約
リモートセンシングオブジェクト検出(RSOD)は、多くの場合、低空間分解能、センサーノイズ、モーションブラー、有害照明などの分解に苦しんでいます。
これらの要因は、特徴の特徴を低下させ、曖昧なオブジェクト表現と不十分な前景の中央分離につながります。
既存のRSODメソッドは、低品質のオブジェクトの堅牢な検出に制限を示します。
これらのプレスの課題に対処するために、低品質のリモートセンシング画像から派生した特徴表現を強化するために特別に設計された新しいエッジガウス集約(EGA)モジュールを特徴とする軽量バックボーンネットワークであるLegNetを紹介します。
EGAモジュールは以下を統合します。(a)方向を認識しているScharrフィルターは、低コントラストまたはぼやけたオブジェクトで失われる重要なエッジの詳細を研ぎ澄まし、(b)ノイズを抑制し、曖昧な特徴応答を正規化し、困難な条件下で前景の顕著性を強化するためのガウス型の特徴の改良を削減します。
EGAモジュールは、劣化した画像で一般的なコントラストの減少、構造的不連続性、およびあいまいな特徴応答の低下で一般的な問題を軽減し、計算効率を維持しながらモデルの堅牢性を効果的に改善します。
5つのベンチマーク(DOTA-V1.0、v1.5、Dior-R、Fair1m-V1.0、およびVisdrone2019)にわたる包括的な評価は、LEGNETが特に低品質のオブジェクトの検出において最先端のパフォーマンスを達成することを示しています。
このコードは、https://github.com/lwcver/legnetで入手できます。
要約(オリジナル)
Remote sensing object detection (RSOD) often suffers from degradations such as low spatial resolution, sensor noise, motion blur, and adverse illumination. These factors diminish feature distinctiveness, leading to ambiguous object representations and inadequate foreground-background separation. Existing RSOD methods exhibit limitations in robust detection of low-quality objects. To address these pressing challenges, we introduce LEGNet, a lightweight backbone network featuring a novel Edge-Gaussian Aggregation (EGA) module specifically engineered to enhance feature representation derived from low-quality remote sensing images. EGA module integrates: (a) orientation-aware Scharr filters to sharpen crucial edge details often lost in low-contrast or blurred objects, and (b) Gaussian-prior-based feature refinement to suppress noise and regularize ambiguous feature responses, enhancing foreground saliency under challenging conditions. EGA module alleviates prevalent problems in reduced contrast, structural discontinuities, and ambiguous feature responses prevalent in degraded images, effectively improving model robustness while maintaining computational efficiency. Comprehensive evaluations across five benchmarks (DOTA-v1.0, v1.5, DIOR-R, FAIR1M-v1.0, and VisDrone2019) demonstrate that LEGNet achieves state-of-the-art performance, particularly in detecting low-quality objects. The code is available at https://github.com/lwCVer/LEGNet.
arxiv情報
著者 | Wei Lu,Si-Bao Chen,Hui-Dong Li,Qing-Ling Shu,Chris H. Q. Ding,Jin Tang,Bin Luo |
発行日 | 2025-06-02 16:04:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google