要約
タイトル:新しい3RLデータセットにおけるリアルタイム顔情報認識の実験的研究
要約:
– リアルタイム顔情報認識は、人間とコンピュータのインタラクション分野において注目されているが、現存する最新のデータセットには、文書の写真など関係のない画像、各クラスの画像数の不均衡、正しい分類に悪影響を与える誤認識を引き起こす誤った画像など、さまざまな問題がある。
– これらの問題を解決するために、新しい3RLデータセットが作成され、約24,000枚の画像が含まれており、一般公開される予定である。このデータセットには、幸福、恐怖、悲しみ、嫌悪、怒りといった5つの基本的な感情がラベル付けされている。
– さらに、この3RLデータセットを、他の有名な最新のデータセット(FERデータセット、CK+データセット)と比較し、過去の研究で最もよく使われていたアルゴリズムであるSVMとCNNを適用した。その結果、generalizationにおいて3RLデータセットにおける顕著な改善が見られた。具体的には、CNNを使用した場合には、最大で91.4%の正解率が得られた。FER2013、CK+の結果はそれぞれ60%から85%程度であった。
要約(オリジナル)
Although real-time facial emotion recognition is a hot topic research domain in the field of human-computer interaction, state-of the-art available datasets still suffer from various problems, such as some unrelated photos such as document photos, unbalanced numbers of photos in each class, and misleading images that can negatively affect correct classification. The 3RL dataset was created, which contains approximately 24K images and will be publicly available, to overcome previously available dataset problems. The 3RL dataset is labelled with five basic emotions: happiness, fear, sadness, disgust, and anger. Moreover, we compared the 3RL dataset with other famous state-of-the-art datasets (FER dataset, CK+ dataset), and we applied the most commonly used algorithms in previous works, SVM and CNN. The results show a noticeable improvement in generalization on the 3RL dataset. Experiments have shown an accuracy of up to 91.4% on 3RL dataset using CNN where results on FER2013, CK+ are, respectively (approximately from 60% to 85%).
arxiv情報
著者 | Rahmeh Abou Zafra,Lana Ahmad Abdullah,Rouaa Alaraj,Rasha Albezreh,Tarek Barhoum,Khloud Al Jallad |
発行日 | 2023-04-06 13:29:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI