cs.SD」カテゴリーアーカイブ

Robust One-Shot Singing Voice Conversion

要約 深層生成モデルの最近の進歩により、音声領域での音声変換の品質が向上しました … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Robust One-Shot Singing Voice Conversion はコメントを受け付けていません

MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement

要約 一般的なニューラル音声強調 (SE) アプローチは主に音声とノイズの混合を … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement はコメントを受け付けていません

HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model

要約 最近、自己教師あり表現学習 (SSRL) 手法の有用性がさまざまな下流タス … 続きを読む

カテゴリー: cs.CL, cs.SD | HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model はコメントを受け付けていません

Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder

要約 認知症の診断には一連の異なる検査方法が必要ですが、これは複雑で時間がかかり … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder はコメントを受け付けていません

Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection

要約 うつ病は一般的な精神障害です。 機械学習によって実現された、音声を使用した … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS, F.2.2 | Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection はコメントを受け付けていません

Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection

要約 自発的な発話からのアルツハイマー病 (AD) の検出はますます注目を集めて … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection はコメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

要約 このレポートは、台湾の客家(六県)の単語/音節の自動認識を実現することを目 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The North System for Formosa Speech Recognition Challenge 2023 はコメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

要約 このレポートは、台湾の客家(六県)の単語/音節の自動認識を実現することを目 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The North System for Formosa Speech Recognition Challenge 2023 はコメントを受け付けていません

BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR

要約 最近提案されたシリアル化出力トレーニング (SOT) は、特殊なトークンで … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR はコメントを受け付けていません

Self-supervised Neural Factor Analysis for Disentangling Utterance-level Speech Representations

要約 wav2vec や HuBERT などの自己教師あり学習 (SSL) 音声 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Self-supervised Neural Factor Analysis for Disentangling Utterance-level Speech Representations はコメントを受け付けていません