eess.AS」カテゴリーアーカイブ

Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection

要約 うつ病は一般的な精神障害です。 機械学習によって実現された、音声を使用した … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS, F.2.2 | Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection はコメントを受け付けていません

Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection

要約 自発的な発話からのアルツハイマー病 (AD) の検出はますます注目を集めて … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection はコメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

要約 このレポートは、台湾の客家(六県)の単語/音節の自動認識を実現することを目 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The North System for Formosa Speech Recognition Challenge 2023 はコメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

要約 このレポートは、台湾の客家(六県)の単語/音節の自動認識を実現することを目 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The North System for Formosa Speech Recognition Challenge 2023 はコメントを受け付けていません

BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR

要約 最近提案されたシリアル化出力トレーニング (SOT) は、特殊なトークンで … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR はコメントを受け付けていません

Evaluating Self-Supervised Speech Representations for Indigenous American Languages

要約 音声表現学習への自己監視の適用は、大量のラベルなしデータに対する拡張性によ … 続きを読む

カテゴリー: cs.CL, eess.AS | Evaluating Self-Supervised Speech Representations for Indigenous American Languages はコメントを受け付けていません

Decoding speech perception from non-invasive brain recordings

要約 脳活動から音声を解読することは、医療と神経科学の両方において待望の目標です … 続きを読む

カテゴリー: cs.AI, cs.LG, eess.AS, q-bio.NC | Decoding speech perception from non-invasive brain recordings はコメントを受け付けていません

Self-supervised Neural Factor Analysis for Disentangling Utterance-level Speech Representations

要約 wav2vec や HuBERT などの自己教師あり学習 (SSL) 音声 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Self-supervised Neural Factor Analysis for Disentangling Utterance-level Speech Representations はコメントを受け付けていません

Prompting and Adapter Tuning for Self-supervised Encoder-Decoder Speech Model

要約 プロンプトとアダプターのチューニングは、ファインチューニング (FT) 方 … 続きを読む

カテゴリー: cs.CL, eess.AS, eess.SP | Prompting and Adapter Tuning for Self-supervised Encoder-Decoder Speech Model はコメントを受け付けていません

UniverSLU: Universal Spoken Language Understanding for Diverse Classification and Sequence Generation Tasks with a Single Network

要約 最近の研究では、マルチタスク機能を備えた大規模な言語モデルを採用することで … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | UniverSLU: Universal Spoken Language Understanding for Diverse Classification and Sequence Generation Tasks with a Single Network はコメントを受け付けていません