Automatic Proficiency Assessment in L2 English Learners

要約

英語の第二言語能力(L2)は通常、英語の教師または専門家の評価者によって知覚的に評価され、固有の評価者間および評価者間変動があります。
このホワイトペーパーでは、包括的なL2習熟度評価のための深い学習技術を調査し、音声信号とその特派員の転写の両方に対処します。
2D CNN、周波数ベースのCNN、RESNET、および事前に処理されたWAV2VEC 2.0モデルを含む多様なアーキテクチャを使用して、音声能力分類予測を分析します。
さらに、リソースの制約内でBERT言語モデルを微調整することにより、テキストベースの習熟度評価を調べます。
最後に、自発的な対話評価の複雑なタスクに取り組み、WAV2VEC 2.0およびBERTモデルの個別のアプリケーションを介して長期のオーディオとスピーカーの相互作用を管理します。
EFCAMDATおよびAnglish Datasetおよびプライベートデータセットの実験の結果、特に自動化されたL2習熟度評価のための、特に前提条件のWAV2VEC 2.0モデルの可能性を強調しています。

要約(オリジナル)

Second language proficiency (L2) in English is usually perceptually evaluated by English teachers or expert evaluators, with the inherent intra- and inter-rater variability. This paper explores deep learning techniques for comprehensive L2 proficiency assessment, addressing both the speech signal and its correspondent transcription. We analyze spoken proficiency classification prediction using diverse architectures, including 2D CNN, frequency-based CNN, ResNet, and a pretrained wav2vec 2.0 model. Additionally, we examine text-based proficiency assessment by fine-tuning a BERT language model within resource constraints. Finally, we tackle the complex task of spontaneous dialogue assessment, managing long-form audio and speaker interactions through separate applications of wav2vec 2.0 and BERT models. Results from experiments on EFCamDat and ANGLISH datasets and a private dataset highlight the potential of deep learning, especially the pretrained wav2vec 2.0 model, for robust automated L2 proficiency evaluation.

arxiv情報

著者 Armita Mohammadi,Alessandro Lameiras Koerich,Laureano Moro-Velazquez,Patrick Cardinal
発行日 2025-05-05 12:36:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク