要約
音声感情認識 (SER) では、実際の重要性を考慮せずに事前定義された特徴を使用すると、冗長で無関係な情報を含む高次元のデータセットが作成される可能性があります。
その結果、高次元学習ではモデルの精度が低下し、計算の複雑さが増加することがよくあります。
私たちの取り組みは、効率的な SER システムを構築するために機能を慎重に検討し分析することの重要性を強調しています。
効率的な特徴エンジニアリング アプローチに基づいた新しい教師あり SER 手法を提案します。
特徴の関連性を評価し、特徴セットを改良するために、結果の説明可能性に特に注意を払っています。
これは、Shapley 値を使用して機能評価ループを通じて繰り返し実行され、機能の選択を強化し、フレームワーク全体のパフォーマンスを向上させます。
したがって、私たちのアプローチにより、モデルのパフォーマンスと透明性の間の利点のバランスをとることができます。
提案された手法は、TESS データセット上の感情認識において、人間レベルのパフォーマンス (HLP) および最先端の機械学習手法を上回ります。
要約(オリジナル)
In speech emotion recognition (SER), using predefined features without considering their practical importance may lead to high dimensional datasets, including redundant and irrelevant information. Consequently, high-dimensional learning often results in decreasing model accuracy while increasing computational complexity. Our work underlines the importance of carefully considering and analyzing features in order to build efficient SER systems. We present a new supervised SER method based on an efficient feature engineering approach. We pay particular attention to the explainability of results to evaluate feature relevance and refine feature sets. This is performed iteratively through feature evaluation loop, using Shapley values to boost feature selection and improve overall framework performance. Our approach allows thus to balance the benefits between model performance and transparency. The proposed method outperforms human-level performance (HLP) and state-of-the-art machine learning methods in emotion recognition on the TESS dataset.
arxiv情報
著者 | Alaa Nfissi,Wassim Bouachir,Nizar Bouguila,Brian Mishara |
発行日 | 2024-05-30 15:44:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google