「eess.AS」カテゴリーアーカイブ

Improving Speech Emotion Recognition with Unsupervised Speaking Style Transfer

投稿日: 2023年12月29日作成者: jarxiv

要約人間は、強勢の配置や感情の強さなど、さまざまな韻律属性を簡単に変更して、一 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Relationship between auditory and semantic entrainment using Deep Neural Networks (DNN)

投稿日: 2023年12月29日作成者: jarxiv

要約人々が相互作用するときに、同様の、一致する、または同期した行動をする傾向は … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Augmenting conformers with structured state-space sequence models for online speech recognition

投稿日: 2023年12月29日作成者: jarxiv

要約モデルが左側のコンテキストにのみアクセスするオンライン音声認識は、ASR … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Audio Generation with Multiple Conditional Diffusion Model

投稿日: 2023年12月29日作成者: jarxiv

要約テキストベースのオーディオ生成モデルには、オーディオ内のすべての情報を網羅 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Cross-Lingual Transfer Learning for Low-Resource Speech Translation

投稿日: 2023年12月29日作成者: jarxiv

要約この論文では、自動音声翻訳の下流アプリケーションにおいて、高リソース言語か … 続きを読む →

カテゴリー: cs.AI, cs.CL, eess.AS, eess.SP | コメントを受け付けていません

Neural Speaker Diarization Using Memory-Aware Multi-Speaker Embedding with Sequence-to-Sequence Architecture

投稿日: 2023年12月27日作成者: jarxiv

要約我々は、メモリ認識マルチスピーカー埋め込み（MA-MSE）とシーケンスツー … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge

投稿日: 2023年12月27日作成者: jarxiv

要約この文書は、車載マルチチャネル自動音声認識に関する ICMC-ASR チャ … 続きを読む →

カテゴリー: cs.AI, eess.AS | コメントを受け付けていません

Auto deep learning for bioacoustic signals

投稿日: 2023年12月27日作成者: jarxiv

要約この研究では、従来の手動で設計されたディープラーニングモデルと比較して … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Transavs: End-To-End Audio-Visual Segmentation With Transformer

投稿日: 2023年12月27日作成者: jarxiv

要約オーディオビジュアルセグメンテーション (AVS) は、オーディオ信号を調 … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

The Effects of Signal-to-Noise Ratio on Generative Adversarial Networks Applied to Marine Bioacoustic Data

投稿日: 2023年12月25日作成者: jarxiv

要約近年、敵対的生成ネットワーク (GAN) は、海洋生物音響学の分野でデータ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Improving Speech Emotion Recognition with Unsupervised Speaking Style Transfer

Relationship between auditory and semantic entrainment using Deep Neural Networks (DNN)

Augmenting conformers with structured state-space sequence models for online speech recognition

Audio Generation with Multiple Conditional Diffusion Model

Cross-Lingual Transfer Learning for Low-Resource Speech Translation

Neural Speaker Diarization Using Memory-Aware Multi-Speaker Embedding with Sequence-to-Sequence Architecture

The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge

Auto deep learning for bioacoustic signals

Transavs: End-To-End Audio-Visual Segmentation With Transformer

The Effects of Signal-to-Noise Ratio on Generative Adversarial Networks Applied to Marine Bioacoustic Data

最近の投稿

最近のコメント

アーカイブ

カテゴリー