「cs.SD」カテゴリーアーカイブ

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

投稿日: 2023年4月10日作成者: jarxiv

要約タイトル：医療現場における自動音声認識性能の向上に向けたクリニカルBERT … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Adoption of AI Technology in the Music Mixing Workflow: An Investigation

投稿日: 2023年4月10日作成者: jarxiv

要約タイトル：「音楽ミキシングワークフローにおけるAI技術の採用：調査」要約 … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.SD, eess.AS | コメントを受け付けていません

DSVAE: Interpretable Disentangled Representation for Synthetic Speech Detection

投稿日: 2023年4月10日作成者: jarxiv

要約タイトル：DSVAE：合成音声検出のための解釈可能な分離表現要約： &# … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Efficient Audio Captioning Transformer with Patchout and Text Guidance

投稿日: 2023年4月7日作成者: jarxiv

要約タイトル：Patchoutおよびテキストガイダンスを用いた効率的な音声キャ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS, F.2.2 | コメントを受け付けていません

On the Impact of Voice Anonymization on Speech-Based COVID-19 Detection

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル: 音声匿名化が発話に基づくCOVID-19検出に与える影響につい … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Beyond Universal Transformer: block reusing with adaptor in Transformer for automatic speech recognition

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル：Beyond Universal Transformer：自動音 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Vision Transformers are Parameter-Efficient Audio-Visual Learners

投稿日: 2023年4月6日作成者: jarxiv

要約【タイトル】ビジョン・トランスフォーマーは効率的なパラメーターでオーディオ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Dual-Attention Neural Transducers for Efficient Wake Word Spotting in Speech Recognition

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル: 話者認識における二重注視ニューラルトランスデューサーによる効率 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル: AUDIT: Audio Editing by Followi … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Dual-Attention Neural Transducers for Efficient Wake Word Spotting in Speech Recognition

投稿日: 2023年4月5日作成者: jarxiv

要約タイトル：音声認識における効率的なウェイクワード検出のためのデュアルアテン … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

Adoption of AI Technology in the Music Mixing Workflow: An Investigation

DSVAE: Interpretable Disentangled Representation for Synthetic Speech Detection

Efficient Audio Captioning Transformer with Patchout and Text Guidance

On the Impact of Voice Anonymization on Speech-Based COVID-19 Detection

Beyond Universal Transformer: block reusing with adaptor in Transformer for automatic speech recognition

Vision Transformers are Parameter-Efficient Audio-Visual Learners

Dual-Attention Neural Transducers for Efficient Wake Word Spotting in Speech Recognition

AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models

Dual-Attention Neural Transducers for Efficient Wake Word Spotting in Speech Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー