MSLIQA: Enhancing Learning Representations for Image Quality Assessment through Multi-Scale Learning

要約

非参照画像品質評価 (NR-IQA) は、歪みの多様性と注釈付きの大規模なデータセットの欠如により、依然として困難なタスクです。
多くの研究では、より正確な NR-IQA モデルを開発することによって、多くの場合複雑で計算コストのかかるネットワークを採用したり、さまざまな歪み間のドメイン ギャップを橋渡ししてテスト データセットのパフォーマンスを向上させたりすることで、これらの課題に対処しようと試みてきました。
私たちの研究では、パフォーマンスをほぼ 28\% 向上させる新しい拡張戦略を導入することで、汎用の軽量 NR-IQA モデルのパフォーマンスを向上させました。
この拡張戦略により、ネットワークはズームインおよびズームアウトすることで、画像のさまざまな部分のさまざまな歪みをより適切に識別できるようになります。
さらに、テスト時の拡張機能を組み込むことでパフォーマンスがさらに向上し、拡張機能を使用するだけで軽量ネットワークの結果が現在の最先端モデルと同等になります。

要約(オリジナル)

No-Reference Image Quality Assessment (NR-IQA) remains a challenging task due to the diversity of distortions and the lack of large annotated datasets. Many studies have attempted to tackle these challenges by developing more accurate NR-IQA models, often employing complex and computationally expensive networks, or by bridging the domain gap between various distortions to enhance performance on test datasets. In our work, we improve the performance of a generic lightweight NR-IQA model by introducing a novel augmentation strategy that boosts its performance by almost 28\%. This augmentation strategy enables the network to better discriminate between different distortions in various parts of the image by zooming in and out. Additionally, the inclusion of test-time augmentation further enhances performance, making our lightweight network’s results comparable to the current state-of-the-art models, simply through the use of augmentations.

arxiv情報

著者 Nasim Jamshidi Avanaki,Abhijay Ghildyal,Nabajeet Barman,Saman Zadtootaghaj
発行日 2024-09-06 17:17:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.MM パーマリンク