eess.AS」カテゴリーアーカイブ

Sim-T: Simplify the Transformer Network by Multiplexing Technique for Speech Recognition

要約 タイトル:音声認識向けTransformerネットワークをMultiple … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Sim-T: Simplify the Transformer Network by Multiplexing Technique for Speech Recognition はコメントを受け付けていません

AffectMachine-Classical: A novel system for generating affective classical music

要約 タイトル:感情的なクラシック音楽を生成するための新しいシステム、Affec … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.MM, cs.SD, eess.AS, J.5; J.4 | AffectMachine-Classical: A novel system for generating affective classical music はコメントを受け付けていません

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

要約 TITLE – ESPnet-ST-v2:多目的音声言語翻訳ツ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit はコメントを受け付けていません

An Empirical Study and Improvement for Speech Emotion Recognition

要約 タイトル:発話感情認識のための実証的研究と改善 要約: – マ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | An Empirical Study and Improvement for Speech Emotion Recognition はコメントを受け付けていません

An investigation of speaker independent phrase break models in End-to-End TTS systems

要約 タイトル:End-to-End TTSシステムにおける話者非依存フレーズブ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | An investigation of speaker independent phrase break models in End-to-End TTS systems はコメントを受け付けていません

Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions

要約 タイトル:音声認識転写におけるリスナーアウェアなバックチャンネル予測 要約 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions はコメントを受け付けていません

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

要約 タイトル:ESPnet-ST-v2:多目的口頭言語翻訳ツールキット 要約: … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit はコメントを受け付けていません

M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval

要約 タイトル:M-SpeechCLIP:大規模な事前トレーニング済みモデルを利 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval はコメントを受け付けていません

Enhancing Speech-to-Speech Translation with Multiple TTS Targets

要約 タイトル:複数のTTSターゲットを用いた音声-音声翻訳の向上 要約: &# … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Enhancing Speech-to-Speech Translation with Multiple TTS Targets はコメントを受け付けていません

FAIR4Cov: Fused Audio Instance and Representation for COVID-19 Detection

要約 タイトル: FAIR4Cov: COVID-19検出のための融合されたオー … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | FAIR4Cov: Fused Audio Instance and Representation for COVID-19 Detection はコメントを受け付けていません