要約
このペーパーでは、高解像度の画像モーションの脱毛のための包括的な研究とRESTOMERアーキテクチャの改善を紹介します。
最適化された注意メカニズムを通じてパフォーマンスを維持または改善しながら、モデルの複雑さを18.4%減らすアーキテクチャの変更を導入します。
拡張されたトレーニングパイプラインには、カラージッター、ガウスブラー、およびパースペクティブ変換などの追加の変換が組み込まれており、モデルの堅牢性と新しい周波数損失項を改善します。
RealBlur-R、RealBlur-J、および超高解像度モーションのぼやけた(UHDM)データセットに関する広範な実験は、アプローチの有効性を示しています。
改善されたアーキテクチャは、挑戦的なシナリオ全体で競争力のあるパフォーマンスを維持しながら、より良い収束行動とトレーニング時間の短縮を示しています。
また、モデルの動作とパフォーマンスに対する変更の影響を分析する詳細なアブレーション研究も提供します。
我々の結果は、思慮深い建築の単純化と強化されたトレーニング戦略を組み合わせて、モーションデブラリングタスクのより効率的で等しく能力のあるモデルを生成できることを示唆しています。
コードとデータは、https://github.com/hamzafer/image-debluringで利用可能です
要約(オリジナル)
This paper presents a comprehensive study and improvement of the Restormer architecture for high-resolution image motion deblurring. We introduce architectural modifications that reduce model complexity by 18.4% while maintaining or improving performance through optimized attention mechanisms. Our enhanced training pipeline incorporates additional transformations including color jitter, Gaussian blur, and perspective transforms to improve model robustness as well as a new frequency loss term. Extensive experiments on the RealBlur-R, RealBlur-J, and Ultra-High-Definition Motion blurred (UHDM) datasets demonstrate the effectiveness of our approach. The improved architecture shows better convergence behavior and reduced training time while maintaining competitive performance across challenging scenarios. We also provide detailed ablation studies analyzing the impact of our modifications on model behavior and performance. Our results suggest that thoughtful architectural simplification combined with enhanced training strategies can yield more efficient yet equally capable models for motion deblurring tasks. Code and Data Available at: https://github.com/hamzafer/image-deblurring
arxiv情報
著者 | Amanturdieva Akmaral,Muhammad Hamza Zafar |
発行日 | 2025-01-30 14:58:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google