Hybrid Facial Expression Recognition (FER2013) Model for Real-Time Emotion Classification and Prediction

要約

表情認識は、人工知能やゲームからヒューマン コンピュータ インタラクション (HCI) や心理学に至るまで、ほとんどの分野で重要な研究テーマです。
この論文では、深層畳み込みニューラル ネットワーク (DCNN) と Haar Cascade 深層学習アーキテクチャを含む、顔の表情認識のハイブリッド モデルを提案します。
目的は、リアルタイムおよびデジタルの顔画像を、考慮される 7 つの顔の感情カテゴリのいずれかに分類することです。
この研究で採用されている DCNN には、より多くの畳み込み層、ReLU Activation 関数、および複数のカーネルがあり、フィルタリングの深さと顔の特徴の抽出を強化しています。
さらに、Haar カスケード モデルを相互に使用して、リアルタイムの画像とビデオ フレームの顔の特徴を検出しました。
Kaggle リポジトリ (FER-2013) からのグレースケール画像と、グラフィックス プロセッシング ユニット (GPU) 計算を利用して、トレーニングと検証プロセスを促進しました。
トレーニングの効率と分類のパフォーマンスを向上させるために、前処理とデータ拡張の手法が適用されます。
実験結果は、最先端の (SoTA) 実験および研究と比較して、大幅に改善された分類パフォーマンスを示しています。
また、他の従来のモデルと比較して、この論文では、提案されたアーキテクチャが最大 6% の改善、合計で最大 70% の精度、2098.8 秒の実行時間の短縮により、分類性能が優れていることを検証します。

要約(オリジナル)

Facial Expression Recognition is a vital research topic in most fields ranging from artificial intelligence and gaming to Human-Computer Interaction (HCI) and Psychology. This paper proposes a hybrid model for Facial Expression recognition, which comprises a Deep Convolutional Neural Network (DCNN) and Haar Cascade deep learning architectures. The objective is to classify real-time and digital facial images into one of the seven facial emotion categories considered. The DCNN employed in this research has more convolutional layers, ReLU Activation functions, and multiple kernels to enhance filtering depth and facial feature extraction. In addition, a haar cascade model was also mutually used to detect facial features in real-time images and video frames. Grayscale images from the Kaggle repository (FER-2013) and then exploited Graphics Processing Unit (GPU) computation to expedite the training and validation process. Pre-processing and data augmentation techniques are applied to improve training efficiency and classification performance. The experimental results show a significantly improved classification performance compared to state-of-the-art (SoTA) experiments and research. Also, compared to other conventional models, this paper validates that the proposed architecture is superior in classification performance with an improvement of up to 6%, totaling up to 70% accuracy, and with less execution time of 2098.8s.

arxiv情報

著者 Ozioma Collins Oguine,Kanyifeechukwu Jane Oguine,Hashim Ibrahim Bisallah,Daniel Ofuani
発行日 2022-08-01 07:49:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.HC, cs.RO パーマリンク