「cs.SD」カテゴリーアーカイブ

Robust One-Shot Singing Voice Conversion

投稿日: 2023年10月9日作成者: jarxiv

要約深層生成モデルの最近の進歩により、音声領域での音声変換の品質が向上しました … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement

投稿日: 2023年10月9日作成者: jarxiv

要約一般的なニューラル音声強調 (SE) アプローチは主に音声とノイズの混合を … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model

投稿日: 2023年10月9日作成者: jarxiv

要約最近、自己教師あり表現学習 (SSRL) 手法の有用性がさまざまな下流タス … 続きを読む →

カテゴリー: cs.CL, cs.SD | コメントを受け付けていません

Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder

投稿日: 2023年10月9日作成者: jarxiv

要約認知症の診断には一連の異なる検査方法が必要ですが、これは複雑で時間がかかり … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection

投稿日: 2023年10月9日作成者: jarxiv

要約うつ病は一般的な精神障害です。機械学習によって実現された、音声を使用した … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS, F.2.2 | コメントを受け付けていません

Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection

投稿日: 2023年10月9日作成者: jarxiv

要約自発的な発話からのアルツハイマー病 (AD) の検出はますます注目を集めて … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

投稿日: 2023年10月9日作成者: jarxiv

要約このレポートは、台湾の客家（六県）の単語/音節の自動認識を実現することを目 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

The North System for Formosa Speech Recognition Challenge 2023

投稿日: 2023年10月6日作成者: jarxiv

要約このレポートは、台湾の客家（六県）の単語/音節の自動認識を実現することを目 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR

投稿日: 2023年10月6日作成者: jarxiv

要約最近提案されたシリアル化出力トレーニング (SOT) は、特殊なトークンで … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Self-supervised Neural Factor Analysis for Disentangling Utterance-level Speech Representations

投稿日: 2023年10月5日作成者: jarxiv

要約 wav2vec や HuBERT などの自己教師あり学習 (SSL) 音声 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

Robust One-Shot Singing Voice Conversion

MBTFNet: Multi-Band Temporal-Frequency Neural Network For Singing Voice Enhancement

HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model

Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder

Hierarchical attention interpretation: an interpretable speech-level transformer for bi-modal depression detection

Transferring speech-generic and depression-specific knowledge for Alzheimer’s disease detection

The North System for Formosa Speech Recognition Challenge 2023

The North System for Formosa Speech Recognition Challenge 2023

BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR

Self-supervised Neural Factor Analysis for Disentangling Utterance-level Speech Representations

最近の投稿

最近のコメント

アーカイブ

カテゴリー