要約
標準化された大規模な畜産の需要と人工知能技術の開発により、豚、牛、羊、その他の家畜に関する動物の顔認識の分野で多くの研究が行われました。
顔認識は、顔検出、顔正規化、顔識別の 3 つのサブタスクで構成されます。
動物の顔認識研究のほとんどは、顔検出と顔識別に焦点を当てています。
動物は写真を撮るときに非協力的であることが多いため、収集された動物の顔画像はしばしば任意の方向を向いています。
非標準の画像を使用すると、顔認識システムのパフォーマンスが大幅に低下する可能性があります。
しかし、動物の顔画像を任意の方向に正規化する研究は行われていない。
この研究では、動物の顔の回転角度と位置を 1 段階で検出できる新しい回転角度コーディング法を含む、軽量の角度検出および領域ベースの畳み込みネットワーク (LAD-RCNN) を開発しました。
LAD-RCNN は、単一の GeForce RTX 2080 Ti GPU で 72.74 FPS (すべてのステップを含む) のフレーム レートを持っています。
LAD-RCNN は、ヤギ データセットや gaot 赤外線画像を含む複数のデータセットで評価されています。
評価結果は、すべてのテスト データセットで、顔検出の AP が 95% を超え、検出された回転角度とグラウンド トゥルースの回転角度との偏差が 0.036 (つまり 6.48{\deg}) 未満であることを示しています。
これは、LAD-RCNN が家畜の顔とその方向検出で優れた性能を発揮することを示しており、家畜の顔検出と正規化に非常に適しています。
コードは https://github.com/SheepBreedingLab-HZAU/LAD-RCNN/ で入手できます。
要約(オリジナル)
With the demand for standardized large-scale livestock farming and the development of artificial intelligence technology, a lot of research in area of animal face recognition were carried on pigs, cattle, sheep and other livestock. Face recognition consists of three sub-task: face detection, face normalizing and face identification. Most of animal face recognition study focuses on face detection and face identification. Animals are often uncooperative when taking photos, so the collected animal face images are often in arbitrary directions. The use of non-standard images may significantly reduce the performance of face recognition system. However, there is no study on normalizing of the animal face image with arbitrary directions. In this study, we developed a light-weight angle detection and region-based convolutional network (LAD-RCNN) containing a new rotation angle coding method that can detect the rotation angle and the location of animal face in one-stage. LAD-RCNN has a frame rate of 72.74 FPS (including all steps) on a single GeForce RTX 2080 Ti GPU. LAD-RCNN has been evaluated on multiple dataset including goat dataset and gaot infrared image. Evaluation result show that the AP of face detection was more than 95% and the deviation between the detected rotation angle and the ground-truth rotation angle were less than 0.036 (i.e. 6.48{\deg}) on all the test dataset. This shows that LAD-RCNN has excellent performance on livestock face and its direction detection, and therefore it is very suitable for livestock face detection and Normalizing. Code is available at https://github.com/SheepBreedingLab-HZAU/LAD-RCNN/
arxiv情報
著者 | Ling Sun,Guiqiong Liu,Junrui Liu,Xunping Jiang,Xu Wang,Han Yang,Shiping Yang |
発行日 | 2022-10-31 08:54:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google