cs.SD」カテゴリーアーカイブ

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

要約 TITLE – ESPnet-ST-v2:多目的音声言語翻訳ツ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit はコメントを受け付けていません

An Empirical Study and Improvement for Speech Emotion Recognition

要約 タイトル:発話感情認識のための実証的研究と改善 要約: – マ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | An Empirical Study and Improvement for Speech Emotion Recognition はコメントを受け付けていません

An investigation of speaker independent phrase break models in End-to-End TTS systems

要約 タイトル:End-to-End TTSシステムにおける話者非依存フレーズブ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | An investigation of speaker independent phrase break models in End-to-End TTS systems はコメントを受け付けていません

Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions

要約 タイトル:音声認識転写におけるリスナーアウェアなバックチャンネル予測 要約 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions はコメントを受け付けていません

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

要約 タイトル:ESPnet-ST-v2:多目的口頭言語翻訳ツールキット 要約: … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit はコメントを受け付けていません

M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval

要約 タイトル:M-SpeechCLIP:大規模な事前トレーニング済みモデルを利 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval はコメントを受け付けていません

Enhancing Speech-to-Speech Translation with Multiple TTS Targets

要約 タイトル:複数のTTSターゲットを用いた音声-音声翻訳の向上 要約: &# … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Enhancing Speech-to-Speech Translation with Multiple TTS Targets はコメントを受け付けていません

FAIR4Cov: Fused Audio Instance and Representation for COVID-19 Detection

要約 タイトル: FAIR4Cov: COVID-19検出のための融合されたオー … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | FAIR4Cov: Fused Audio Instance and Representation for COVID-19 Detection はコメントを受け付けていません

Anomalous Sound Detection using Audio Representation with Machine ID based Contrastive Learning Pretraining

要約 タイトル:機械IDベースの対比学習による音声表現を用いた異常音の検出 要約 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Anomalous Sound Detection using Audio Representation with Machine ID based Contrastive Learning Pretraining はコメントを受け付けていません

To Wake-up or Not to Wake-up: Reducing Keyword False Alarm by Successive Refinement

要約 タイトル: 連続した改善によるキーワードの誤設定の軽減 要約: &#821 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS, eess.SP | To Wake-up or Not to Wake-up: Reducing Keyword False Alarm by Successive Refinement はコメントを受け付けていません