A Single Graph Convolution Is All You Need: Efficient Grayscale Image Classification

要約

画像分類器はタスクを畳み込みニューラル ネットワーク (CNN) に依存することがよくありますが、画像分類の場合、実行する操作の数により待ち時間が長くなり、リアルタイム アプリケーションでは問題となる可能性があります。
さらに、多くの画像分類モデルは、RGB データセットとグレースケール データセットの両方で機能します。
グレースケール画像のみを処理する分類子は、それほど一般的ではありません。
グレースケール画像分類には、医療画像分類や合成開口レーダー (SAR) 自動目標認識 (ATR) など、さまざまな用途がありますが、これらに限定されません。
したがって、画像のベクトル化されたビューを使用した新しいグレースケール画像分類アプローチを提案します。
画像をベクトルとして表示し、問題設定をグレースケール画像分類設定に減らすことで、MLP の軽量性を活用します。
単一のグラフ畳み込み層をバッチ単位で使用すると、精度が向上し、モデルのパフォーマンスのばらつきが減少することがわかりました。
さらに、提案されたモデル用に、パフォーマンスを向上させるためにいくつかの最適化を行ったカスタマイズされたアクセラレータを FPGA 上で開発します。
ベンチマークのグレースケール画像データセットに関する私たちの実験結果は、提案されたモデルの有効性を示しており、さまざまな画像分類モデルで他の最先端の画像分類モデルと比較して、大幅に低いレイテンシ (最大 16$\times$ 未満) と競争力のある、または優れたパフォーマンスを達成しています。
ドメイン固有のグレースケール画像分類データセット。

要約(オリジナル)

Image classifiers often rely on convolutional neural networks (CNN) for their tasks, which, for image classification, experience high latency due to the number of operations they perform, which can be problematic in real-time applications. Additionally, many image classification models work on both RGB and grayscale datasets. Classifiers that operate solely on grayscale images are much less common. Grayscale image classification has diverse applications, including but not limited to medical image classification and synthetic aperture radar (SAR) automatic target recognition (ATR). Thus, we present a novel grayscale image classification approach using a vectorized view of images. We exploit the lightweightness of MLPs by viewing images as vectors and reducing our problem setting to the grayscale image classification setting. We find that using a single graph convolutional layer batch-wise increases accuracy and reduces variance in the performance of our model. Moreover, we develop a customized accelerator on FPGA for the proposed model with several optimizations to improve its performance. Our experimental results on benchmark grayscale image datasets demonstrate the effectiveness of the proposed model, achieving vastly lower latency (up to 16$\times$ less) and competitive or leading performance compared to other state-of-the-art image classification models on various domain-specific grayscale image classification datasets.

arxiv情報

著者 Jacob Fein-Ashley,Tian Ye,Sachini Wickramasinghe,Bingyi Zhang,Rajgopal Kannan,Viktor Prasanna
発行日 2024-06-20 13:45:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク