eess.AS」カテゴリーアーカイブ

An investigation of speaker independent phrase break models in End-to-End TTS systems

要約 タイトル:End-to-End TTSシステムにおける話者非依存フレーズブ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | An investigation of speaker independent phrase break models in End-to-End TTS systems はコメントを受け付けていません

Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions

要約 タイトル:音声認識転写におけるリスナーアウェアなバックチャンネル予測 要約 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions はコメントを受け付けていません

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

要約 タイトル:ESPnet-ST-v2:多目的口頭言語翻訳ツールキット 要約: … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit はコメントを受け付けていません

M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval

要約 タイトル:M-SpeechCLIP:大規模な事前トレーニング済みモデルを利 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval はコメントを受け付けていません

Enhancing Speech-to-Speech Translation with Multiple TTS Targets

要約 タイトル:複数のTTSターゲットを用いた音声-音声翻訳の向上 要約: &# … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Enhancing Speech-to-Speech Translation with Multiple TTS Targets はコメントを受け付けていません

FAIR4Cov: Fused Audio Instance and Representation for COVID-19 Detection

要約 タイトル: FAIR4Cov: COVID-19検出のための融合されたオー … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | FAIR4Cov: Fused Audio Instance and Representation for COVID-19 Detection はコメントを受け付けていません

Anomalous Sound Detection using Audio Representation with Machine ID based Contrastive Learning Pretraining

要約 タイトル:機械IDベースの対比学習による音声表現を用いた異常音の検出 要約 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Anomalous Sound Detection using Audio Representation with Machine ID based Contrastive Learning Pretraining はコメントを受け付けていません

To Wake-up or Not to Wake-up: Reducing Keyword False Alarm by Successive Refinement

要約 タイトル: 連続した改善によるキーワードの誤設定の軽減 要約: &#821 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS, eess.SP | To Wake-up or Not to Wake-up: Reducing Keyword False Alarm by Successive Refinement はコメントを受け付けていません

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

要約 タイトル:医療現場における自動音声認識性能の向上に向けたクリニカルBERT … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings はコメントを受け付けていません

Adoption of AI Technology in the Music Mixing Workflow: An Investigation

要約 タイトル:「音楽ミキシングワークフローにおけるAI技術の採用:調査」 要約 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.SD, eess.AS | Adoption of AI Technology in the Music Mixing Workflow: An Investigation はコメントを受け付けていません