要約
画像強化方法は、多くの場合、ピクセルレベルの情報を優先し、セマンティック機能を見下ろします。
画像の明るさ、コントラスト、およびガンマパラメーターを最適化して視覚品質とセマンティックの忠実度のバランスをとる、NSGA-IIアルゴリズムによって導かれる、監視されていない、ファジーに触発された画像強化フレームワークを提案します。
提案された方法の中心は、特徴抽出器として事前に訓練されたディープニューラルネットワークを使用することです。
最適な拡張設定を見つけるために、複数の目的のバランスをとるGPUアクセラル化NSGA-IIアルゴリズムを使用します。つまり、画像エントロピーの増加、知覚の類似性の向上、適切な明るさの維持を使用します。
さらに、現地の検索フェーズを適用して、遺伝的アルゴリズムから上位候補者を微調整することにより、結果を改善します。
私たちのアプローチは、ペアリングされたトレーニングデータなしで完全に動作し、限られたラベルまたはノイズの多いラベルを持つドメインに広く適用されます。
定量的に、私たちのモデルは、すべての対応のないデータセットで、それぞれ平均19.82と3.652の平均ブリスクスコアとNiqeスコアで優れたパフォーマンスを達成します。
定性的に、私たちのモデルによる強化された画像は、影のある領域での視界、コントラストの自然なバランスを大幅に改善し、顕著なアーティファクトを導入することなく、より豊かな細部を維持します。
この作業は、セマンティックの一貫性が重要である監視されていない画像強化のための新しい方向を開きます。
要約(オリジナル)
Image enhancement methods often prioritize pixel level information, overlooking the semantic features. We propose a novel, unsupervised, fuzzy-inspired image enhancement framework guided by NSGA-II algorithm that optimizes image brightness, contrast, and gamma parameters to achieve a balance between visual quality and semantic fidelity. Central to our proposed method is the use of a pre trained deep neural network as a feature extractor. To find the best enhancement settings, we use a GPU-accelerated NSGA-II algorithm that balances multiple objectives, namely, increasing image entropy, improving perceptual similarity, and maintaining appropriate brightness. We further improve the results by applying a local search phase to fine-tune the top candidates from the genetic algorithm. Our approach operates entirely without paired training data making it broadly applicable across domains with limited or noisy labels. Quantitatively, our model achieves excellent performance with average BRISQUE and NIQE scores of 19.82 and 3.652, respectively, in all unpaired datasets. Qualitatively, enhanced images by our model exhibit significantly improved visibility in shadowed regions, natural balance of contrast and also preserve the richer fine detail without introducing noticable artifacts. This work opens new directions for unsupervised image enhancement where semantic consistency is critical.
arxiv情報
著者 | Nirjhor Datta,Afroza Akther,M. Sohel Rahman |
発行日 | 2025-05-16 13:40:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google