Person Detection Using an Ultra Low-resolution Thermal Imager on a Low-cost MCU

要約

ニューラル ネットワークを使用して画像またはビデオ内の人物を検出することは、文献でよく研究されているテーマです。
ただし、このような作業は通常、適切な解像度のカメラと、検出アルゴリズムを実行するための高性能プロセッサまたは GPU の可用性を前提としているため、完全な検出システムのコストが大幅に増加します。
ただし、多くのアプリケーションでは、安価なセンサーと単純なマイクロコントローラーで構成される低コストのソリューションが必要です。
この論文では、そのようなハードウェア上でさえ、単純な古典的な画像処理技術に縛られていないことを示しています。
低コストの 32×24 ピクセル静止画像装置からのサーマル ビデオを処理する、新しい超軽量の CNN ベースの人物検出器を提案します。
独自に記録されたデータセットでトレーニングおよび圧縮されたモデルは、最大 91.62% の精度 (F1 スコア) を達成し、10,000 未満のパラメーターを持ち、低コストのマイクロコントローラー STM32F407 および STM32F746 でそれぞれ 87 ミリ秒および 46 ミリ秒の速度で実行されます。

要約(オリジナル)

Detecting persons in images or video with neural networks is a well-studied subject in literature. However, such works usually assume the availability of a camera of decent resolution and a high-performance processor or GPU to run the detection algorithm, which significantly increases the cost of a complete detection system. However, many applications require low-cost solutions, composed of cheap sensors and simple microcontrollers. In this paper, we demonstrate that even on such hardware we are not condemned to simple classic image processing techniques. We propose a novel ultra-lightweight CNN-based person detector that processes thermal video from a low-cost 32×24 pixel static imager. Trained and compressed on our own recorded dataset, our model achieves up to 91.62% accuracy (F1-score), has less than 10k parameters, and runs as fast as 87ms and 46ms on low-cost microcontrollers STM32F407 and STM32F746, respectively.

arxiv情報

著者 Maarten Vandersteegen,Wouter Reusen,Kristof Van Beeck,Toon Goedemé
発行日 2022-12-16 11:27:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク