Underwater Image Enhancement via Dehazing and Color Restoration

要約

水中の視覚イメージングは​​海洋工学にとって重要ですが、下流の分析を妨げるコントラスト、ぼやき、色の劣化が低いです。
既存の水中画像強化方法は、しばしばヘイズとカラーキャストを統一された分解プロセスとして扱い、相乗的な関係を見落としながら固有の独立性を無視します。
この制限を克服するために、水中の画質を改善するために、Vision Transformer(VIT)ベースのネットワーク(Waterformerと呼ばれる)を提案します。
Waterformerには、3つの主要なコンポーネントが含まれています。自己相関したヘイズ機能をキャプチャし、深いレベルの特徴を抽出するための脱ヘージブロック(Dehazeformerブロック)、自己相関カラーキャストの特徴をキャプチャするカラー修復ブロック(CRB)、およびこれらのデカップされた機能を動的に統合するチャネルフュージョンブロック(CFB)をキャプチャします。
信頼性を確保するために、水中イメージング物理学モデルに基づいたソフト再構成層が含まれています。
さらに、色の一貫性の損失とSOBELの色の損失は、それぞれ色の忠実度を維持し、ネットワークトレーニング中に構造の詳細を強化するように設計されています。
包括的な実験結果は、ウォーターフォーマーが水中画像を強化する他の最先端の方法を上回ることを示しています。

要約(オリジナル)

Underwater visual imaging is crucial for marine engineering, but it suffers from low contrast, blurriness, and color degradation, which hinders downstream analysis. Existing underwater image enhancement methods often treat the haze and color cast as a unified degradation process, neglecting their inherent independence while overlooking their synergistic relationship. To overcome this limitation, we propose a Vision Transformer (ViT)-based network (referred to as WaterFormer) to improve underwater image quality. WaterFormer contains three major components: a dehazing block (DehazeFormer Block) to capture the self-correlated haze features and extract deep-level features, a Color Restoration Block (CRB) to capture self-correlated color cast features, and a Channel Fusion Block (CFB) that dynamically integrates these decoupled features to achieve comprehensive enhancement. To ensure authenticity, a soft reconstruction layer based on the underwater imaging physics model is included. Further, a Chromatic Consistency Loss and Sobel Color Loss are designed to respectively preserve color fidelity and enhance structural details during network training. Comprehensive experimental results demonstrate that WaterFormer outperforms other state-of-the-art methods in enhancing underwater images.

arxiv情報

著者 Chengqin Wu,Shuai Yu,Tuyan Luo,Qiuhua Rao,Qingson Hu,Jingxiang Xu,Lijun Zhang
発行日 2025-04-30 12:21:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク