eess.AS」カテゴリーアーカイブ

MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement

要約 一般的なニューラル音声強調 (SE) アプローチは主に音声とノイズの混合を … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement はコメントを受け付けていません

Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder

要約 認知症の診断には一連の異なる検査方法が必要ですが、これは複雑で時間がかかり … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder はコメントを受け付けていません

Zero-shot Domain-sensitive Speech Recognition with Prompt-conditioning Fine-tuning

要約 この研究では、特定のテキスト プロンプトに基づいてテキスト ドメイン情報の … 続きを読む

カテゴリー: cs.CL, cs.LG, eess.AS | Zero-shot Domain-sensitive Speech Recognition with Prompt-conditioning Fine-tuning はコメントを受け付けていません

Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection

要約 うつ病は一般的な精神障害です。 機械学習によって実現された、音声を使用した … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS, F.2.2 | Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection はコメントを受け付けていません

Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection

要約 自発的な発話からのアルツハイマー病 (AD) の検出はますます注目を集めて … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection はコメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

要約 このレポートは、台湾の客家(六県)の単語/音節の自動認識を実現することを目 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The North System for Formosa Speech Recognition Challenge 2023 はコメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

要約 このレポートは、台湾の客家(六県)の単語/音節の自動認識を実現することを目 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The North System for Formosa Speech Recognition Challenge 2023 はコメントを受け付けていません

BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR

要約 最近提案されたシリアル化出力トレーニング (SOT) は、特殊なトークンで … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR はコメントを受け付けていません

Evaluating Self-Supervised Speech Representations for Indigenous American Languages

要約 音声表現学習への自己監視の適用は、大量のラベルなしデータに対する拡張性によ … 続きを読む

カテゴリー: cs.CL, eess.AS | Evaluating Self-Supervised Speech Representations for Indigenous American Languages はコメントを受け付けていません

Decoding speech perception from non-invasive brain recordings

要約 脳活動から音声を解読することは、医療と神経科学の両方において待望の目標です … 続きを読む

カテゴリー: cs.AI, cs.LG, eess.AS, q-bio.NC | Decoding speech perception from non-invasive brain recordings はコメントを受け付けていません