「eess.AS」カテゴリーアーカイブ

Speech-based Slot Filling using Large Language Models

投稿日: 2023年11月14日作成者: jarxiv

要約最近、大規模言語モデル (LLM) の進歩により、さまざまな言語タスクにわ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Byte Pair Encoding for Symbolic Music

投稿日: 2023年11月14日作成者: jarxiv

要約深層学習で使用される場合、シンボリック音楽モダリティは言語モデルアーキテ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

E2E Spoken Entity Extraction for Virtual Agents

投稿日: 2023年11月13日作成者: jarxiv

要約人間とコンピューターの会話では、音声から名前、住所、電子メールアドレスな … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Parkinson’s Disease Detection through Vocal Biomarkers and Advanced Machine Learning Algorithms: A Comprehensive Study

投稿日: 2023年11月10日作成者: jarxiv

要約パーキンソン病 (PD) は、運動ニューロンに影響を及ぼし、震え、硬直、歩 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Towards End-to-End Spoken Grammatical Error Correction

投稿日: 2023年11月10日作成者: jarxiv

要約文法的なフィードバックは、L2 の学習者、教師、試験者にとって非常に重要で … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS | コメントを受け付けていません

What Do I Hear? Generating Sounds for Visuals with ChatGPT

投稿日: 2023年11月10日作成者: jarxiv

要約この短いペーパーでは、ビジュアルメディアのリアルなサウンドスケープを生成 … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Loss Masking Is Not Needed in Decoder-only Transformer for Discrete-token Based ASR

投稿日: 2023年11月9日作成者: jarxiv

要約最近、SpeechGPT、VioLA、AudioPaLM などの統合音声テ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Speech language models lack important brain-relevant semantics

投稿日: 2023年11月9日作成者: jarxiv

要約脳における読むことと聞くことの違いは知られていますが、最近の研究では、テキ … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS, q-bio.NC | コメントを受け付けていません

Diff-HierVC: Diffusion-based Hierarchical Voice Conversion with Robust Pitch Generation and Masked Prior for Zero-shot Speaker Adaptation

投稿日: 2023年11月9日作成者: jarxiv

要約音声変換 (VC) システムは音声スタイルを転送する顕著な能力を示していま … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS, eess.SP | コメントを受け付けていません

Rethinking and Improving Multi-task Learning for End-to-end Speech Translation

投稿日: 2023年11月8日作成者: jarxiv

要約マルチタスク学習の適用により、エンドツーエンドの音声翻訳 (ST) が大幅 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Speech-based Slot Filling using Large Language Models

Byte Pair Encoding for Symbolic Music

E2E Spoken Entity Extraction for Virtual Agents

Parkinson’s Disease Detection through Vocal Biomarkers and Advanced Machine Learning Algorithms: A Comprehensive Study

Towards End-to-End Spoken Grammatical Error Correction

What Do I Hear? Generating Sounds for Visuals with ChatGPT

Loss Masking Is Not Needed in Decoder-only Transformer for Discrete-token Based ASR

Speech language models lack important brain-relevant semantics

Diff-HierVC: Diffusion-based Hierarchical Voice Conversion with Robust Pitch Generation and Masked Prior for Zero-shot Speaker Adaptation

Rethinking and Improving Multi-task Learning for End-to-end Speech Translation

最近の投稿

最近のコメント

アーカイブ

カテゴリー