Dynamic Resolution Guidance for Facial Expression Recognition

要約

顔の表情認識 (FER) は、人間とコンピューターのインタラクションや感情分析に不可欠ですが、低解像度の画像内の表情を認識することは依然として困難です。
この論文では、FER モデルの精度を損なうことなく、さまざまな解像度の画像内の表情を効果的に認識するための顔表情認識のための動的解像度ガイダンス (DRGFER) と呼ばれる実用的な方法を紹介します。
私たちのフレームワークは、解像度認識ネットワーク (RRN) と多重解像度適応表情認識ネットワーク (MRAFER) という 2 つの主要コンポーネントで構成されています。
RRN は画像の解像度を決定し、バイナリ ベクトルを出力し、MRAFER は解像度に基づいて画像を適切な表情認識ネットワークに割り当てます。
私たちは、広く使用されているデータセット RAFDB および FERPlus で DRGFER を評価し、私たちの方法が各解像度で最適なモデルのパフォーマンスを維持し、他の解像度のアプローチよりも優れていることを実証しました。
提案されたフレームワークは、解像度の変動や表情に対する堅牢性を示し、現実世界のアプリケーションに有望なソリューションを提供します。

要約(オリジナル)

Facial expression recognition (FER) is vital for human-computer interaction and emotion analysis, yet recognizing expressions in low-resolution images remains challenging. This paper introduces a practical method called Dynamic Resolution Guidance for Facial Expression Recognition (DRGFER) to effectively recognize facial expressions in images with varying resolutions without compromising FER model accuracy. Our framework comprises two main components: the Resolution Recognition Network (RRN) and the Multi-Resolution Adaptation Facial Expression Recognition Network (MRAFER). The RRN determines image resolution, outputs a binary vector, and the MRAFER assigns images to suitable facial expression recognition networks based on resolution. We evaluated DRGFER on widely-used datasets RAFDB and FERPlus, demonstrating that our method retains optimal model performance at each resolution and outperforms alternative resolution approaches. The proposed framework exhibits robustness against resolution variations and facial expressions, offering a promising solution for real-world applications.

arxiv情報

著者 Jie Ou,Xu Li,Tianxiang Jiang,Yuanlun Xie
発行日 2024-04-09 15:02:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.MM パーマリンク