Privileged Attribution Constrained Deep Networks for Facial Expression Recognition

要約

顔の表情の認識(FER)は、機械が人間の行動をよりよく理解できるようにするため、多くの研究分野で非常に重要です。
FERメソッドは、従来のネットワークをうまく一般化できない比較的小さなデータセットとノイズの多いデータの問題に直面しています。
これらの問題を軽減するために、モデルをガイドして、目、口、眉毛などの特定の顔の領域に集中します。これらの領域は、顔の表情を認識するために決定的であると主張しています。
顔のランドマークによって形成されたヒートマップに対応するように属性マップを奨励することにより、モデルの注意を最も顕著な顔の領域に向ける方法である特権属性損失(PAL)を提案します。
さらに、モデルがより多くの自由度を持つことを可能にするいくつかのチャネル戦略を紹介します。
提案された方法はバックボーンアーキテクチャから独立しており、テスト時に追加のセマンティック情報を必要としません。
最後に、実験結果は、提案されたPAL法が、RAF-DBとAffectNetの両方で現在の最先端の方法よりも優れていることを示しています。

要約(オリジナル)

Facial Expression Recognition (FER) is crucial in many research domains because it enables machines to better understand human behaviours. FER methods face the problems of relatively small datasets and noisy data that don’t allow classical networks to generalize well. To alleviate these issues, we guide the model to concentrate on specific facial areas like the eyes, the mouth or the eyebrows, which we argue are decisive to recognise facial expressions. We propose the Privileged Attribution Loss (PAL), a method that directs the attention of the model towards the most salient facial regions by encouraging its attribution maps to correspond to a heatmap formed by facial landmarks. Furthermore, we introduce several channel strategies that allow the model to have more degrees of freedom. The proposed method is independent of the backbone architecture and doesn’t need additional semantic information at test time. Finally, experimental results show that the proposed PAL method outperforms current state-of-the-art methods on both RAF-DB and AffectNet.

arxiv情報

著者 Jules Bonnard,Arnaud Dapogny,Ferdinand Dhombres,Kévin Bailly
発行日 2022-06-30 13:14:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク