Development of a face mask detection pipeline for mask-wearing monitoring in the era of the COVID-19 pandemic: A modular approach

要約

SARS-Cov-2 パンデミックの間、マスクの着用は、ウイルスの拡散と感染を防ぐための効果的なツールになりました。
人口のマスク着用率を監視する機能は、ウイルスに対する公衆衛生戦略を決定するのに役立ちます。
しかし、フェイスマスクを検出するための人工知能技術は、公共の場でのマスク着用率を測定するために実際に大規模に展開されていません.
このホワイト ペーパーでは、2 つの個別のモジュールで構成される 2 段階のフェイス マスク検出アプローチを紹介します。1) 顔の検出と位置合わせ、および 2) フェイス マスクの分類です。
このアプローチにより、顔検出モジュールと顔マスク分類モジュールのさまざまな組み合わせを試すことができました。
より具体的には、フェイスマスク分類モジュールの軽量バックボーンを維持しながら、顔検出器として PyramidKey と RetinaFace を実験しました。
さらに、一部の顔画像の誤ったラベルを修正した AIZOO データセットのテスト セットのラベルを付け直したアノテーションも提供します。
AIZOO および Moxa 3K データセットの評価結果は、提案されたフェイス マスク検出パイプラインが最先端の方法を凌駕することを示しました。
また、提案されたパイプラインは、AIZOO データセットの再ラベル付けされたテスト セットで、元のテスト セットよりも高い mAP をもたらしました。
野生の顔画像を使用して提案されたモデルをトレーニングしたので、パブリック CCTV 画像を使用してマスク着用率を監視するためにモデルを正常に展開できます。

要約(オリジナル)

During the SARS-Cov-2 pandemic, mask-wearing became an effective tool to prevent spreading and contracting the virus. The ability to monitor the mask-wearing rate in the population would be useful for determining public health strategies against the virus. However, artificial intelligence technologies for detecting face masks have not been deployed at a large scale in real-life to measure the mask-wearing rate in public. In this paper, we present a two-step face mask detection approach consisting of two separate modules: 1) face detection and alignment and 2) face mask classification. This approach allowed us to experiment with different combinations of face detection and face mask classification modules. More specifically, we experimented with PyramidKey and RetinaFace as face detectors while maintaining a lightweight backbone for the face mask classification module. Moreover, we also provide a relabeled annotation of the test set of the AIZOO dataset, where we rectified the incorrect labels for some face images. The evaluation results on the AIZOO and Moxa 3K datasets showed that the proposed face mask detection pipeline surpassed the state-of-the-art methods. The proposed pipeline also yielded a higher mAP on the relabeled test set of the AIZOO dataset than the original test set. Since we trained the proposed model using in-the-wild face images, we can successfully deploy our model to monitor the mask-wearing rate using public CCTV images.

arxiv情報

著者 Benjaphan Sommana,Ukrit Watchareeruetai,Ankush Ganguly,Samuel W. F. Earp,Taya Kitiyakara,Suparee Boonmanunt,Ratchainant Thammasudjarit
発行日 2022-08-01 11:37:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク