要約
タイトル:ブラーイメージ分類のためのパッチ単位の特徴
要約:
– スマートフォンカメラでキャプチャされた画像は、模糊などの劣化現象によってしばしば損傷を受けるため、これらの画像を後続のタスクのために処理することは困難を伴う。
– 本研究では、画像品質評価のための低コンピュートライトでパッチ単位の特徴を提案している。
– 提案された方法を用いることで、ボケた画像の劣化と鮮明な画像の差別化が可能。
– このため、グレイレベル分散、一次および二次勾配、ローカルバイナリパターンなどの直感的な画像特徴を含む、決定木ベースのXGBoostモデルをトレーニングした。
– オープンデータセット上の実験では、提案された低コンピュート法は、このタスクにファインチューニングされた94%の平均精度を持つコンピュート集約型VGG16ネットワークの90.1%の平均精度に匹敵することが示された。
– また、提案された特徴とモデルの一般性を示すために、BHBIDデータセットと内部データセットでモデルをテストし、それぞれ98%と91%の精度を得た。
– 提案された方法は、CPU上でVGG16ベースのモデルよりも10倍高速であり、入力画像サイズに線形にスケールするため、低コンピュートエッジデバイスに実装することが適している。
要約(オリジナル)
Images captured through smartphone cameras often suffer from degradation, blur being one of the major ones, posing a challenge in processing these images for downstream tasks. In this paper we propose low-compute lightweight patch-wise features for image quality assessment. Using our method we can discriminate between blur vs sharp image degradation. To this end, we train a decision-tree based XGBoost model on various intuitive image features like gray level variance, first and second order gradients, texture features like local binary patterns. Experiments conducted on an open dataset show that the proposed low compute method results in 90.1% mean accuracy on the validation set, which is comparable to the accuracy of a compute-intensive VGG16 network with 94% mean accuracy fine-tuned to this task. To demonstrate the generalizability of our proposed features and model we test the model on BHBID dataset and an internal dataset where we attain accuracy of 98% and 91%, respectively. The proposed method is 10x faster than the VGG16 based model on CPU and scales linearly to the input image size making it suitable to be implemented on low compute edge devices.
arxiv情報
著者 | Sri Charan Kattamuru,Kshitij Agrawal,Shyam Prasad Adhikari,Abhishek Bose,Hemant Misra |
発行日 | 2023-04-06 15:39:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI