Assessing The Impact of CNN Auto Encoder-Based Image Denoising on Image Classification Tasks

要約

現実世界からキャプチャされた画像はさまざまな種類のノイズの影響を受けることが多く、コンピューター ビジョン システムのパフォーマンスや視覚データの品質に大きな影響を与える可能性があります。
この研究では、特に水中ポンプのインペラに焦点を当てた、鋳造製品のノイズの多い画像における欠陥検出のための新しいアプローチを紹介します。
この方法論では、VGG16、InceptionV3、その他の空間領域と周波数領域の両方のモデルなどの深層学習モデルを利用して、ノイズの種類と欠陥の状態を特定します。
研究プロセスは画像の前処理から始まり、続いて特定のノイズ カテゴリに合わせたノイズ除去技術を適用します。
目標は、ノイズ検出とノイズ除去を分類パイプラインに統合することで、欠陥検出の精度と堅牢性を向上させることです。
この研究では、周波数領域でのノイズ タイプ分類に VGG16 を使用し、99% 以上の精度を達成するという顕著な結果を達成しました。
ごま塩ノイズの除去では平均 SSIM が 87.9 になり、ガウス ノイズの除去では平均 SSIM が 64.0 になり、周期的なノイズの除去では平均 SSIM が 81.6 になりました。
この包括的なアプローチは、実際の産業アプリケーションにおけるノイズ除去戦略に対するディープ AutoEncoder モデルとメディアン フィルターの有効性を示しています。
最後に、私たちの研究では、以前の方法と比較して欠陥検出のバイナリ分類精度が大幅に向上したことを報告しています。
VGG16 分類器の場合、精度は 94.6% から 97.0% に向上し、提案されたノイズ検出およびノイズ除去アプローチの有効性が実証されました。
同様に、InceptionV3 分類器の場合、精度が 84.7% から 90.0% に向上し、ノイズ分析を分類パイプラインに統合する利点がさらに検証されました。

要約(オリジナル)

Images captured from the real world are often affected by different types of noise, which can significantly impact the performance of Computer Vision systems and the quality of visual data. This study presents a novel approach for defect detection in casting product noisy images, specifically focusing on submersible pump impellers. The methodology involves utilizing deep learning models such as VGG16, InceptionV3, and other models in both the spatial and frequency domains to identify noise types and defect status. The research process begins with preprocessing images, followed by applying denoising techniques tailored to specific noise categories. The goal is to enhance the accuracy and robustness of defect detection by integrating noise detection and denoising into the classification pipeline. The study achieved remarkable results using VGG16 for noise type classification in the frequency domain, achieving an accuracy of over 99%. Removal of salt and pepper noise resulted in an average SSIM of 87.9, while Gaussian noise removal had an average SSIM of 64.0, and periodic noise removal yielded an average SSIM of 81.6. This comprehensive approach showcases the effectiveness of the deep AutoEncoder model and median filter, for denoising strategies in real-world industrial applications. Finally, our study reports significant improvements in binary classification accuracy for defect detection compared to previous methods. For the VGG16 classifier, accuracy increased from 94.6% to 97.0%, demonstrating the effectiveness of the proposed noise detection and denoising approach. Similarly, for the InceptionV3 classifier, accuracy improved from 84.7% to 90.0%, further validating the benefits of integrating noise analysis into the classification pipeline.

arxiv情報

著者 Mohsen Hami,Mahdi JameBozorg
発行日 2024-04-16 15:40:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク