要約
合成開口レーダー(SAR)の船舶のインスタンスセグメンテーションは、海事監視、環境分析、国家安全保障などの用途にとって重要です。
SAR船の画像は、既存の方法で見落とされることが多く、最適ではないパフォーマンスにつながる、スケールの変動、オブジェクト密度、ファジーターゲット境界などの課題を提示します。
この作業では、SAR画像の構造特性を完全に活用することによりMask2Formerを拡張するカスタマーされたインスタンスセグメンテーションフレームワークであるO2Formerを提案します。
2つの重要なコンポーネントを紹介します。
1つ目は、最適化されたクエリジェネレーター(OQG)です。
これにより、浅い位置の手がかりと高レベルのセマンティック情報を共同でエンコードすることにより、マルチスケール機能の相互作用が可能になります。
これにより、クエリの品質と収束効率が向上します。
2番目のコンポーネントは、方向を認識している埋め込みモジュール(OAEM)です。
方向に触れた畳み込みと極性エンコーディングを通じて方向感度を高めます。
これは、SARシーンの不均一なターゲット向けの課題に効果的に対処します。
一緒に、これらのモジュールは、バックボーンからデコーダーへの正確な特徴のアライメントを促進し、微調整された構造の詳細をキャプチャするモデルの能力を強化します。
広範な実験は、O2Formerが最先端のインスタンスセグメンテーションベースラインを上回り、SAR船データセットに対するその有効性と一般化を検証することを示しています。
要約(オリジナル)
Instance segmentation of ships in synthetic aperture radar (SAR) imagery is critical for applications such as maritime monitoring, environmental analysis, and national security. SAR ship images present challenges including scale variation, object density, and fuzzy target boundary, which are often overlooked in existing methods, leading to suboptimal performance. In this work, we propose O2Former, a tailored instance segmentation framework that extends Mask2Former by fully leveraging the structural characteristics of SAR imagery. We introduce two key components. The first is the Optimized Query Generator(OQG). It enables multi-scale feature interaction by jointly encoding shallow positional cues and high-level semantic information. This improves query quality and convergence efficiency. The second component is the Orientation-Aware Embedding Module(OAEM). It enhances directional sensitivity through direction-aware convolution and polar-coordinate encoding. This effectively addresses the challenge of uneven target orientations in SAR scenes. Together, these modules facilitate precise feature alignment from backbone to decoder and strengthen the model’s capacity to capture fine-grained structural details. Extensive experiments demonstrate that O2Former outperforms state of the art instance segmentation baselines, validating its effectiveness and generalization on SAR ship datasets.
arxiv情報
著者 | F. Gao,Y Li,X He,J Sun,J Wang |
発行日 | 2025-06-13 16:06:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google