eess.AS」カテゴリーアーカイブ

Audio Generation with Multiple Conditional Diffusion Model

要約 テキストベースのオーディオ生成モデルには、オーディオ内のすべての情報を網羅 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Audio Generation with Multiple Conditional Diffusion Model はコメントを受け付けていません

Cross-Lingual Transfer Learning for Low-Resource Speech Translation

要約 この論文では、自動音声翻訳の下流アプリケーションにおいて、高リソース言語か … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS, eess.SP | Cross-Lingual Transfer Learning for Low-Resource Speech Translation はコメントを受け付けていません

Neural Speaker Diarization Using Memory-Aware Multi-Speaker Embedding with Sequence-to-Sequence Architecture

要約 我々は、メモリ認識マルチスピーカー埋め込み(MA-MSE)とシーケンスツー … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Neural Speaker Diarization Using Memory-Aware Multi-Speaker Embedding with Sequence-to-Sequence Architecture はコメントを受け付けていません

The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge

要約 この文書は、車載マルチチャネル自動音声認識に関する ICMC-ASR チャ … 続きを読む

カテゴリー: cs.AI, eess.AS | The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge はコメントを受け付けていません

Auto deep learning for bioacoustic signals

要約 この研究では、従来の手動で設計されたディープ ラーニング モデルと比較して … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | Auto deep learning for bioacoustic signals はコメントを受け付けていません

Transavs: End-To-End Audio-Visual Segmentation With Transformer

要約 オーディオビジュアルセグメンテーション (AVS) は、オーディオ信号を調 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Transavs: End-To-End Audio-Visual Segmentation With Transformer はコメントを受け付けていません

The Effects of Signal-to-Noise Ratio on Generative Adversarial Networks Applied to Marine Bioacoustic Data

要約 近年、敵対的生成ネットワーク (GAN) は、海洋生物音響学の分野でデータ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | The Effects of Signal-to-Noise Ratio on Generative Adversarial Networks Applied to Marine Bioacoustic Data はコメントを受け付けていません

BLSTM-Based Confidence Estimation for End-to-End Speech Recognition

要約 自動音声認識 (ASR) 仮説において認識された各トークン (単語、サブワ … 続きを読む

カテゴリー: cs.CL, eess.AS | BLSTM-Based Confidence Estimation for End-to-End Speech Recognition はコメントを受け付けていません

Creating New Voices using Normalizing Flows

要約 トレーニング中に目に見えない音声アイデンティティにとって、リアルで自然な響 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Creating New Voices using Normalizing Flows はコメントを受け付けていません

Unsupervised Melody-to-Lyric Generation

要約 メロディーから歌詞への自動生成は、指定されたメロディーに合わせて歌詞を生成 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Unsupervised Melody-to-Lyric Generation はコメントを受け付けていません