YOLO-FaceV2: A Scale and Occlusion Aware Face Detector

要約

近年、ディープラーニングに基づく顔検出アルゴリズムが大きく発展している。これらのアルゴリズムは,Faster R-CNNのような2段階検出器と,YOLOのような1段階検出器に大別される.精度と速度のバランスが良いため,1段検出器は多くのアプリケーションで広く利用されている.本論文では、1段階検出器であるYOLOv5をベースにしたリアルタイム顔検出器YOLO-FaceV2 を提案する。YOLO-FaceV2には、RFEと呼ばれるReceptive Field Enhancementモジュールと、NWD Lossを用いることにより、微小物体の位置ずれに対するIoUの感度を補うことを目的としています。また、顔面隠蔽に対しては、SEAMと呼ばれる注意モジュールを提示し、その解決にRepulsion Lossを導入しています。さらに、簡単なサンプルと難しいサンプルの間の不均衡を解決するために重み関数Slideを用い、アンカーを設計するために有効受容野の情報を使用する。WiderFaceデータセットを用いた実験の結果、我々の顔検出器はYOLOを凌駕し、その変形がeasy, medium, hardの全てのサブセットで発見できることが示された。ソースコード https://github.com/Krasjet-Yu/YOLO-FaceV2

要約(オリジナル)

In recent years, face detection algorithms based on deep learning have made great progress. These algorithms can be generally divided into two categories, i.e. two-stage detector like Faster R-CNN and one-stage detector like YOLO. Because of the better balance between accuracy and speed, one-stage detectors have been widely used in many applications. In this paper, we propose a real-time face detector based on the one-stage detector YOLOv5, named YOLO-FaceV2. We design a Receptive Field Enhancement module called RFE to enhance receptive field of small face, and use NWD Loss to make up for the sensitivity of IoU to the location deviation of tiny objects. For face occlusion, we present an attention module named SEAM and introduce Repulsion Loss to solve it. Moreover, we use a weight function Slide to solve the imbalance between easy and hard samples and use the information of the effective receptive field to design the anchor. The experimental results on WiderFace dataset show that our face detector outperforms YOLO and its variants can be find in all easy, medium and hard subsets. Source code in https://github.com/Krasjet-Yu/YOLO-FaceV2

arxiv情報

著者 Ziping Yu,Hongbo Huang,Weijun Chen,Yongxin Su,Yahui Liu,Xiuying Wang
発行日 2022-08-04 16:29:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク