Why do CNNs excel at feature extraction? A mathematical explanation

要約

過去 10 年にわたり、ディープ ラーニングはコンピューター ビジョンの分野に革命をもたらし、畳み込みニューラル ネットワーク モデルは画像分類ベンチマークに非常に効果的であることが証明されました。
しかし、基本的な理論上の疑問は依然として解決されています。なぜ特徴抽出を伴う離散画像分類タスクを解決できるのでしょうか?
この論文では、現実世界のデータセットに似た画像を生成するために使用できる、特徴抽出に基づく画像分類のための新しい数学的モデルを導入することで、この疑問に取り組みます。
畳み込みニューラル ネットワーク分類器がこれらの画像分類タスクをエラーなしで解決できることを示します。
私たちの証明では、特徴の存在を検出する区分的線形関数を構築し、それらが畳み込みネットワークによって実現できることを示します。

要約(オリジナル)

Over the past decade deep learning has revolutionized the field of computer vision, with convolutional neural network models proving to be very effective for image classification benchmarks. However, a fundamental theoretical questions remain answered: why can they solve discrete image classification tasks that involve feature extraction? We address this question in this paper by introducing a novel mathematical model for image classification, based on feature extraction, that can be used to generate images resembling real-world datasets. We show that convolutional neural network classifiers can solve these image classification tasks with zero error. In our proof, we construct piecewise linear functions that detect the presence of features, and show that they can be realized by a convolutional network.

arxiv情報

著者 Vinoth Nandakumar,Arush Tagade,Tongliang Liu
発行日 2023-07-03 10:41:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, I.2.0 パーマリンク