DeTurb: Atmospheric Turbulence Mitigation with Deformable 3D Convolutions and 3D Swin Transformers


ランダムな摂動と幾何学的歪みは、変形可能な 3D 畳み込みを備えたピラミッド アーキテクチャを使用して除去され、整列したフレームが得られます。
これらのフレームは、3D Swin Transformer のマルチスケール アーキテクチャを通じて鮮明で鮮明な画像を再構築するために使用されます。
提案されたフレームワークは、妥当な速度とモデル サイズで、合成および実際の大気乱流効果の両方について、最先端技術を上回る優れたパフォーマンスを示します。


Atmospheric turbulence in long-range imaging significantly degrades the quality and fidelity of captured scenes due to random variations in both spatial and temporal dimensions. These distortions present a formidable challenge across various applications, from surveillance to astronomy, necessitating robust mitigation strategies. While model-based approaches achieve good results, they are very slow. Deep learning approaches show promise in image and video restoration but have struggled to address these spatiotemporal variant distortions effectively. This paper proposes a new framework that combines geometric restoration with an enhancement module. Random perturbations and geometric distortion are removed using a pyramid architecture with deformable 3D convolutions, resulting in aligned frames. These frames are then used to reconstruct a sharp, clear image via a multi-scale architecture of 3D Swin Transformers. The proposed framework demonstrates superior performance over the state of the art for both synthetic and real atmospheric turbulence effects, with reasonable speed and model size.


著者 Zhicheng Zou,Nantheera Anantrasirichai
発行日 2024-07-30 14:31:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク