eess.AS」カテゴリーアーカイブ

Token-Level Serialized Output Training for Joint Streaming ASR and ST Leveraging Textual Alignments

要約 実際のアプリケーションでは、特に増分生成が必要なストリーミング シナリオで … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Token-Level Serialized Output Training for Joint Streaming ASR and ST Leveraging Textual Alignments はコメントを受け付けていません

WACO: Word-Aligned Contrastive Learning for Speech Translation

要約 エンドツーエンド音声翻訳 (E2E ST) は、ソース音声をターゲット テ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | WACO: Word-Aligned Contrastive Learning for Speech Translation はコメントを受け付けていません

LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT

要約 LyricWhiz は、ロックやメタルなどの難しいジャンルでも、さまざまな … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT はコメントを受け付けていません

The Relationship Between Speech Features Changes When You Get Depressed: Feature Correlations for Improving Speed and Performance of Depression Detection

要約 この研究は、うつ病によって音声から抽出された特徴間の相関が変化することを示 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The Relationship Between Speech Features Changes When You Get Depressed: Feature Correlations for Improving Speed and Performance of Depression Detection はコメントを受け付けていません

Transfer Learning for the Efficient Detection of COVID-19 from Smartphone Audio Data

要約 スマートフォン データからの病気の検出は、モバイル ヘルス (m-heal … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Transfer Learning for the Efficient Detection of COVID-19 from Smartphone Audio Data はコメントを受け付けていません

Track Mix Generation on Music Streaming Services using Transformers

要約 本稿では、音楽ストリーミングサービス Deezer で 2022 年にリリ … 続きを読む

カテゴリー: cs.IR, cs.LG, cs.SD, eess.AS | Track Mix Generation on Music Streaming Services using Transformers はコメントを受け付けていません

Align With Purpose: Optimize Desired Properties in CTC Models with a General Plug-and-Play Framework

要約 コネクショニスト時間分類 (CTC) は、教師ありシーケンスツーシーケンス … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Align With Purpose: Optimize Desired Properties in CTC Models with a General Plug-and-Play Framework はコメントを受け付けていません

The Singing Voice Conversion Challenge 2023

要約 共通のデータセットに基づいてさまざまな音声変換 (VC) システムを比較し … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The Singing Voice Conversion Challenge 2023 はコメントを受け付けていません

The Relationship Between Speech Features Changes When You Get Depressed: Feature Correlations for Improving Speed and Performance of Depression Detection

要約 この研究は、うつ病によって音声から抽出された特徴間の相関が変化することを示 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The Relationship Between Speech Features Changes When You Get Depressed: Feature Correlations for Improving Speed and Performance of Depression Detection はコメントを受け付けていません

Self-supervised representations in speech-based depression detection

要約 この論文では、自己教師あり学習 (SSL) で事前トレーニングされた基礎モ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Self-supervised representations in speech-based depression detection はコメントを受け付けていません