「eess.AS」カテゴリーアーカイブ

MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement

投稿日: 2023年10月9日作成者: jarxiv

要約一般的なニューラル音声強調 (SE) アプローチは主に音声とノイズの混合を … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder

投稿日: 2023年10月9日作成者: jarxiv

要約認知症の診断には一連の異なる検査方法が必要ですが、これは複雑で時間がかかり … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Zero-shot Domain-sensitive Speech Recognition with Prompt-conditioning Fine-tuning

投稿日: 2023年10月9日作成者: jarxiv

要約この研究では、特定のテキストプロンプトに基づいてテキストドメイン情報の … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS | コメントを受け付けていません

Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection

投稿日: 2023年10月9日作成者: jarxiv

要約うつ病は一般的な精神障害です。機械学習によって実現された、音声を使用した … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS, F.2.2 | コメントを受け付けていません

Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection

投稿日: 2023年10月9日作成者: jarxiv

要約自発的な発話からのアルツハイマー病 (AD) の検出はますます注目を集めて … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

投稿日: 2023年10月9日作成者: jarxiv

要約このレポートは、台湾の客家（六県）の単語/音節の自動認識を実現することを目 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

投稿日: 2023年10月6日作成者: jarxiv

要約このレポートは、台湾の客家（六県）の単語/音節の自動認識を実現することを目 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR

投稿日: 2023年10月6日作成者: jarxiv

要約最近提案されたシリアル化出力トレーニング (SOT) は、特殊なトークンで … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Evaluating Self-Supervised Speech Representations for Indigenous American Languages

投稿日: 2023年10月6日作成者: jarxiv

要約音声表現学習への自己監視の適用は、大量のラベルなしデータに対する拡張性によ … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

Decoding speech perception from non-invasive brain recordings

投稿日: 2023年10月6日作成者: jarxiv

要約脳活動から音声を解読することは、医療と神経科学の両方において待望の目標です … 続きを読む →

カテゴリー: cs.AI, cs.LG, eess.AS, q-bio.NC | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement

Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder

Zero-shot Domain-sensitive Speech Recognition with Prompt-conditioning Fine-tuning

Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection

Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection

The North System for Formosa Speech Recognition Challenge 2023

The North System for Formosa Speech Recognition Challenge 2023

BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR

Evaluating Self-Supervised Speech Representations for Indigenous American Languages

Decoding speech perception from non-invasive brain recordings

最近の投稿

最近のコメント

アーカイブ

カテゴリー