要約
$ $CNN の最近の進歩により、精度と待ち時間の点で、高解像度画像のセマンティック セグメンテーションが大幅に改善されました。
ただし、モビリティとレイテンシを維持しながら、混雑したシーン、大規模なバリエーション、部分的なオクルージョン、および歪みのオブジェクトを検出するには、まだ課題が残っています。
これらの問題に対処し、量子化と組み込みハードウェアのサポートを容易にするためにノベルティレイヤーを使用しない、高解像度画像のセマンティックセグメンテーション用の高速で効率的な畳み込みニューラルネットワーク、ASBU-Net を紹介します。
ASBU-Net は、新しい特徴抽出モジュールである Atrous Space Bender Layer (ASBL) に基づいており、計算とメモリの点で効率的です。
ASB 層は、ASBNet を作成するために使用されるビルディング ブロックを形成します。
このネットワークは特別なレイヤーを使用しないため、簡単に実装、量子化、FPGA やメモリが限られているその他のハードウェアに展開できます。
リソースと精度のトレードオフに関する実験を提示し、他の一般的なモデルと比較して強力なパフォーマンスを示します。
要約(オリジナル)
$ $With recent advances in CNNs, exceptional improvements have been made in semantic segmentation of high resolution images in terms of accuracy and latency. However, challenges still remain in detecting objects in crowded scenes, large scale variations, partial occlusion, and distortions, while still maintaining mobility and latency. We introduce a fast and efficient convolutional neural network, ASBU-Net, for semantic segmentation of high resolution images that addresses these problems and uses no novelty layers for ease of quantization and embedded hardware support. ASBU-Net is based on a new feature extraction module, atrous space bender layer (ASBL), which is efficient in terms of computation and memory. The ASB layers form a building block that is used to make ASBNet. Since this network does not use any special layers it can be easily implemented, quantized and deployed on FPGAs and other hardware with limited memory. We present experiments on resource and accuracy trade-offs and show strong performance compared to other popular models.
arxiv情報
著者 | Anurag Bansal,Oleg Ostap,Miguel Maestre Trueba,Kristopher Perry |
発行日 | 2022-12-16 17:42:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google