「cs.SD」カテゴリーアーカイブ

Efficient Sequence Transduction by Jointly Predicting Tokens and Durations

投稿日: 2023年4月17日作成者: jarxiv

要約タイトル：トークンと期間を共同予測することによる効率的なシーケンス変換要 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

HCAM — Hierarchical Cross Attention Model for Multi-modal Emotion Recognition

投稿日: 2023年4月17日作成者: jarxiv

要約タイトル: HCAM – マルチモーダル感情認識のための階層的 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Make More of Your Data: Minimal Effort Data Augmentation for Automatic Speech Recognition and Translation

投稿日: 2023年4月17日作成者: jarxiv

要約タイトル：自動音声認識と翻訳における最小限の努力データ拡張によるデータの最 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

On Data Sampling Strategies for Training Neural Network Speech Separation Models

投稿日: 2023年4月17日作成者: jarxiv

要約タイトル：ニューラルネットワーク音声分離モデルのトレーニングにおけるデータ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.NE, cs.SD, eess.AS | コメントを受け付けていません

A Phoneme-Informed Neural Network Model for Note-Level Singing Transcription

投稿日: 2023年4月13日作成者: jarxiv

要約タイトル：音素情報を利用した音符レベル歌唱転写のニューラルネットワークモデ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Looking Similar, Sounding Different: Leveraging Counterfactual Cross-Modal Pairs for Audiovisual Representation Learning

投稿日: 2023年4月13日作成者: jarxiv

要約タイトル：外見は同じ、音は異なる：カウンターファクトのクロスモーダルペアを … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Soft Dynamic Time Warping for Multi-Pitch Estimation and Beyond

投稿日: 2023年4月12日作成者: jarxiv

要約タイトル：多重ピッチ推定におけるSoft Dynamic Time War … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects

投稿日: 2023年4月12日作成者: jarxiv

要約タイトル：音楽ミキシングスタイルの転送：対比学習アプローチによるオーディオ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Sim-T: Simplify the Transformer Network by Multiplexing Technique for Speech Recognition

投稿日: 2023年4月12日作成者: jarxiv

要約タイトル：音声認識向けTransformerネットワークをMultiple … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

AffectMachine-Classical: A novel system for generating affective classical music

投稿日: 2023年4月12日作成者: jarxiv

要約タイトル：感情的なクラシック音楽を生成するための新しいシステム、Affec … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.MM, cs.SD, eess.AS, J.5; J.4 | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

Efficient Sequence Transduction by Jointly Predicting Tokens and Durations

HCAM — Hierarchical Cross Attention Model for Multi-modal Emotion Recognition

Make More of Your Data: Minimal Effort Data Augmentation for Automatic Speech Recognition and Translation

On Data Sampling Strategies for Training Neural Network Speech Separation Models

A Phoneme-Informed Neural Network Model for Note-Level Singing Transcription

Looking Similar, Sounding Different: Leveraging Counterfactual Cross-Modal Pairs for Audiovisual Representation Learning

Soft Dynamic Time Warping for Multi-Pitch Estimation and Beyond

Music Mixing Style Transfer: A Contrastive Learning Approach to Disentangle Audio Effects

Sim-T: Simplify the Transformer Network by Multiplexing Technique for Speech Recognition

AffectMachine-Classical: A novel system for generating affective classical music

最近の投稿

最近のコメント

アーカイブ

カテゴリー