表情の認識は、コンピューター ビジョンの課題です。
したがって、この論文では、上記の問題を解決するために Resnet と Attention に基づくフレームワークを提案します。
ペナルティ メカニズムを通じて、モデルはトレーニング中の小さなサンプルの学習により注意を払い、結果として生じるモデルの精度の低下は、畳み込みブロック アテンション モジュール (CBAM) によって改善できます。
一方、バックボーン ネットワークは、各サンプルの不確実な機能も学習します。
実験では、表情データセット (AffectNet、RAF-DB など) の精度の点で、私たちの方法がほとんどの基本的な方法を上回っており、クラスの不均衡の問題もうまく解決することが示されています。
Recognition of facial expression is a challenge when it comes to computer vision. The primary reasons are class imbalance due to data collection and uncertainty due to inherent noise such as fuzzy facial expressions and inconsistent labels. However, current research has focused either on the problem of class imbalance or on the problem of uncertainty, ignoring the intersection of how to address these two problems. Therefore, in this paper, we propose a framework based on Resnet and Attention to solve the above problems. We design weight for each class. Through the penalty mechanism, our model will pay more attention to the learning of small samples during training, and the resulting decrease in model accuracy can be improved by a Convolutional Block Attention Module (CBAM). Meanwhile, our backbone network will also learn an uncertain feature for each sample. By mixing uncertain features between samples, the model can better learn those features that can be used for classification, thus suppressing uncertainty. Experiments show that our method surpasses most basic methods in terms of accuracy on facial expression data sets (e.g., AffectNet, RAF-DB), and it also solves the problem of class imbalance well.
著者 | Jiaxiang Fan,Jian Zhou,Xiaoyu Deng,Huabin Wang,Liang Tao,Hon Keung Kwan |
発行日 | 2022-12-15 12:09:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google