「eess.AS」カテゴリーアーカイブ

Make More of Your Data: Minimal Effort Data Augmentation for Automatic Speech Recognition and Translation

投稿日: 2023年4月17日作成者: jarxiv

要約タイトル：自動音声認識と翻訳における最小限の努力データ拡張によるデータの最 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

On Data Sampling Strategies for Training Neural Network Speech Separation Models

投稿日: 2023年4月17日作成者: jarxiv

要約タイトル：ニューラルネットワーク音声分離モデルのトレーニングにおけるデータ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.NE, cs.SD, eess.AS | コメントを受け付けていません

A Phoneme-Informed Neural Network Model for Note-Level Singing Transcription

投稿日: 2023年4月13日作成者: jarxiv

要約タイトル：音素情報を利用した音符レベル歌唱転写のニューラルネットワークモデ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Looking Similar, Sounding Different: Leveraging Counterfactual Cross-Modal Pairs for Audiovisual Representation Learning

投稿日: 2023年4月13日作成者: jarxiv

要約タイトル：外見は同じ、音は異なる：カウンターファクトのクロスモーダルペアを … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Soft Dynamic Time Warping for Multi-Pitch Estimation and Beyond

投稿日: 2023年4月12日作成者: jarxiv

要約タイトル：多重ピッチ推定におけるSoft Dynamic Time War … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects

投稿日: 2023年4月12日作成者: jarxiv

要約タイトル：音楽ミキシングスタイルの転送：対比学習アプローチによるオーディオ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Sim-T: Simplify the Transformer Network by Multiplexing Technique for Speech Recognition

投稿日: 2023年4月12日作成者: jarxiv

要約タイトル：音声認識向けTransformerネットワークをMultiple … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

AffectMachine-Classical: A novel system for generating affective classical music

投稿日: 2023年4月12日作成者: jarxiv

要約タイトル：感情的なクラシック音楽を生成するための新しいシステム、Affec … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.MM, cs.SD, eess.AS, J.5; J.4 | コメントを受け付けていません

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

投稿日: 2023年4月12日作成者: jarxiv

要約 TITLE – ESPnet-ST-v2：多目的音声言語翻訳ツ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

An Empirical Study and Improvement for Speech Emotion Recognition

投稿日: 2023年4月11日作成者: jarxiv

要約タイトル：発話感情認識のための実証的研究と改善要約： – マ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Make More of Your Data: Minimal Effort Data Augmentation for Automatic Speech Recognition and Translation

On Data Sampling Strategies for Training Neural Network Speech Separation Models

A Phoneme-Informed Neural Network Model for Note-Level Singing Transcription

Looking Similar, Sounding Different: Leveraging Counterfactual Cross-Modal Pairs for Audiovisual Representation Learning

Soft Dynamic Time Warping for Multi-Pitch Estimation and Beyond

Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects

Sim-T: Simplify the Transformer Network by Multiplexing Technique for Speech Recognition

AffectMachine-Classical: A novel system for generating affective classical music

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

An Empirical Study and Improvement for Speech Emotion Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー