A Comprehensive Survey of Convolutions in Deep Learning: Applications, Challenges, and Future Trends

要約

今日のデジタル時代では、深層学習 (DL) のサブセットである畳み込みニューラル ネットワーク (CNN) が、画像分類、オブジェクト検出、画像セグメンテーションなどのさまざまなコンピューター ビジョン タスクに広く使用されています。
特定のニーズや要件を満たすように設計された CNN には、1D、2D、3D CNN に加え、拡張、グループ化、アテンション、深さ方向の畳み込み、NAS など、数多くの種類があります。
各タイプの CNN には独自の構造と特性があり、特定のタスクに適しています。
これらのさまざまな CNN タイプを徹底的に理解し、比較分析を実行して、それぞれの長所と短所を理解することが重要です。
さらに、各タイプの CNN のパフォーマンス、制限、実際のアプリケーションを研究することは、将来の新しい改良されたアーキテクチャの開発に役立ちます。
研究者が研究や開発に利用するプラットフォームやフレームワークについても、さまざまな視点から掘り下げていきます。
さらに、6D ビジョン、生成モデル、メタ学習などの CNN の主要な研究分野も調査します。
この調査ペーパーでは、さまざまな CNN アーキテクチャの包括的な調査と比較を提供し、アーキテクチャの違いを強調し、それぞれの利点、欠点、アプリケーション、課題、将来の傾向を強調しています。

要約(オリジナル)

In today’s digital age, Convolutional Neural Networks (CNNs), a subset of Deep Learning (DL), are widely used for various computer vision tasks such as image classification, object detection, and image segmentation. There are numerous types of CNNs designed to meet specific needs and requirements, including 1D, 2D, and 3D CNNs, as well as dilated, grouped, attention, depthwise convolutions, and NAS, among others. Each type of CNN has its unique structure and characteristics, making it suitable for specific tasks. It’s crucial to gain a thorough understanding and perform a comparative analysis of these different CNN types to understand their strengths and weaknesses. Furthermore, studying the performance, limitations, and practical applications of each type of CNN can aid in the development of new and improved architectures in the future. We also dive into the platforms and frameworks that researchers utilize for their research or development from various perspectives. Additionally, we explore the main research fields of CNN like 6D vision, generative models, and meta-learning. This survey paper provides a comprehensive examination and comparison of various CNN architectures, highlighting their architectural differences and emphasizing their respective advantages, disadvantages, applications, challenges, and future trends.

arxiv情報

著者 Abolfazl Younesi,Mohsen Ansari,MohammadAmin Fazli,Alireza Ejlali,Muhammad Shafique,Jörg Henkel
発行日 2024-02-23 18:28:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NE パーマリンク