Efficient High-Resolution Deep Learning: A Survey

要約

スマートフォン、衛星、医療機器などの最新デバイスのカメラは、非常に高解像度の画像やビデオをキャプチャできます。
このような高解像度データは、多くの場合、がんの検出、自動道路ナビゲーション、天気予報、監視、農業プロセスの最適化、およびその他の多くのアプリケーションのための深層学習モデルによって処理する必要があります。
深層学習モデルの直接入力として高解像度の画像とビデオを使用すると、パラメーターの数、計算コスト、推論の待ち時間、GPUメモリの消費量が多いため、多くの課題が発生します。
画像のサイズを低解像度に変更するなどの単純なアプローチは、文献では一般的ですが、通常、精度が大幅に低下します。
文献のいくつかの研究は、ハードウェアの制限と時間の制限に準拠しながら、高解像度データの課題に対処し、精度と速度を向上させるために、より良い代替案を提案しています。
この調査では、このような効率的な高解像度ディープラーニング手法について説明し、高解像度ディープラーニングの実際のアプリケーションを要約し、利用可能な高解像度データセットに関する包括的な情報を提供します。

要約(オリジナル)

Cameras in modern devices such as smartphones, satellites and medical equipment are capable of capturing very high resolution images and videos. Such high-resolution data often need to be processed by deep learning models for cancer detection, automated road navigation, weather prediction, surveillance, optimizing agricultural processes and many other applications. Using high-resolution images and videos as direct inputs for deep learning models creates many challenges due to their high number of parameters, computation cost, inference latency and GPU memory consumption. Simple approaches such as resizing the images to a lower resolution are common in the literature, however, they typically significantly decrease accuracy. Several works in the literature propose better alternatives in order to deal with the challenges of high-resolution data and improve accuracy and speed while complying with hardware limitations and time restrictions. This survey describes such efficient high-resolution deep learning methods, summarizes real-world applications of high-resolution deep learning, and provides comprehensive information about available high-resolution datasets.

arxiv情報

著者 Arian Bakhtiarnia,Qi Zhang,Alexandros Iosifidis
発行日 2022-07-26 17:13:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク