要約
水中画像復元 (UIR) は、水中環境では画像が複雑に劣化するため、コンピューター ビジョンにおける依然として困難なタスクです。
最近のアプローチでは、復元効果の大幅な改善を達成するために、Transformer や複雑なパラメーターを多用したモデルなどのさまざまな深層学習技術が活用されていますが、軽量パラメーターを備えた純粋な CNN アーキテクチャでも同等の結果を達成できることを実証しています。
この論文では、ポリモーフィック ラージ カーネル CNN を活用した水中画像復元の新しい方法である UIR-PolyKernel を紹介します。
私たちのアプローチは、さまざまなサイズと形状の大規模なカーネル畳み込みを独自に組み合わせて、水中画像内の長距離依存関係を効果的にキャプチャします。
さらに、周波数および空間ドメイン アテンション メカニズムを統合して機能の重要性を高めるハイブリッド ドメイン アテンション モジュールを導入します。
周波数ドメインを活用することで、人間には知覚できないかもしれないが、水中画像と地上画像の両方のパターンを識別するために重要な隠れた特徴を捉えることができます。
このアプローチにより、UIR モデルの一般化と堅牢性が強化されます。
ベンチマーク データセットに関する広範な実験により、UIR-PolyKernel が水中画像復元タスクにおいて量的および質的に最先端のパフォーマンスを達成することが実証されました。
私たちの結果は、適切に設計された純粋な CNN アーキテクチャがより複雑なモデルと効果的に競合し、パフォーマンスと計算効率のバランスを提供できることを示しています。
この研究は、水中環境における困難な画像復元タスクに対する CNN ベースのアプローチの可能性についての新たな洞察を提供します。
コードは \href{https://github.com/CXH-Research/UIR-PolyKernel}{https://github.com/CXH-Research/UIR-PolyKernel} で入手できます。
要約(オリジナル)
Underwater Image Restoration (UIR) remains a challenging task in computer vision due to the complex degradation of images in underwater environments. While recent approaches have leveraged various deep learning techniques, including Transformers and complex, parameter-heavy models to achieve significant improvements in restoration effects, we demonstrate that pure CNN architectures with lightweight parameters can achieve comparable results. In this paper, we introduce UIR-PolyKernel, a novel method for underwater image restoration that leverages Polymorphic Large Kernel CNNs. Our approach uniquely combines large kernel convolutions of diverse sizes and shapes to effectively capture long-range dependencies within underwater imagery. Additionally, we introduce a Hybrid Domain Attention module that integrates frequency and spatial domain attention mechanisms to enhance feature importance. By leveraging the frequency domain, we can capture hidden features that may not be perceptible to humans but are crucial for identifying patterns in both underwater and on-air images. This approach enhances the generalization and robustness of our UIR model. Extensive experiments on benchmark datasets demonstrate that UIR-PolyKernel achieves state-of-the-art performance in underwater image restoration tasks, both quantitatively and qualitatively. Our results show that well-designed pure CNN architectures can effectively compete with more complex models, offering a balance between performance and computational efficiency. This work provides new insights into the potential of CNN-based approaches for challenging image restoration tasks in underwater environments. The code is available at \href{https://github.com/CXH-Research/UIR-PolyKernel}{https://github.com/CXH-Research/UIR-PolyKernel}.
arxiv情報
著者 | Xiaojiao Guo,Yihang Dong,Xuhang Chen,Weiwen Chen,Zimeng Li,FuChen Zheng,Chi-Man Pun |
発行日 | 2024-12-24 14:32:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google