eess.AS」カテゴリーアーカイブ

GMM-ResNext: Combining Generative and Discriminative Models for Speaker Verification

要約 ディープラーニングの発展に伴い、話者検証において多くの異なるネットワークア … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.SD, eess.AS | GMM-ResNext: Combining Generative and Discriminative Models for Speaker Verification はコメントを受け付けていません

MuDiT & MuSiT: Alignment with Colloquial Expression in Description-to-Song Generation

要約 生成的AIと人間の芸術的プロセスが交錯する中、本研究では、人間中心の自動作 … 続きを読む

カテゴリー: 68Txx(Primary)14F05, 91Fxx(Secondary), cs.AI, cs.MM, cs.SD, eess.AS, I.2.7 | MuDiT & MuSiT: Alignment with Colloquial Expression in Description-to-Song Generation はコメントを受け付けていません

Naturalistic Music Decoding from EEG Data via Latent Diffusion Models

要約 この論文では、脳波記録から自然主義的な音楽を再構成するタスクに、強力な生成 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Naturalistic Music Decoding from EEG Data via Latent Diffusion Models はコメントを受け付けていません

Naturalistic Music Decoding from EEG Data via Latent Diffusion Models

要約 この記事では、脳波 (EEG) 記録から自然な音楽を再構築するタスクに、強 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Naturalistic Music Decoding from EEG Data via Latent Diffusion Models はコメントを受け付けていません

Open-Source Conversational AI with SpeechBrain 1.0

要約 SpeechBrain は、PyTorch に基づくオープンソースの会話 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, eess.AS | Open-Source Conversational AI with SpeechBrain 1.0 はコメントを受け付けていません

Robust Zero-Shot Text-to-Speech Synthesis with Reverse Inference Optimization

要約 この論文では、人間のフィードバックからの強化学習 (RLHF) を使用して … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Robust Zero-Shot Text-to-Speech Synthesis with Reverse Inference Optimization はコメントを受け付けていません

Towards Robust Speech Representation Learning for Thousands of Languages

要約 自己教師あり学習 (SSL) は、ラベル付きデータの必要性を減らし、音声テ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Towards Robust Speech Representation Learning for Thousands of Languages はコメントを受け付けていません

SlideAVSR: A Dataset of Paper Explanation Videos for Audio-Visual Speech Recognition

要約 オーディオビジュアル音声認識 (AVSR) は、自動音声認識 (ASR) … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | SlideAVSR: A Dataset of Paper Explanation Videos for Audio-Visual Speech Recognition はコメントを受け付けていません

Is one brick enough to break the wall of spoken dialogue state tracking?

要約 タスク指向対話 (TOD) システムでは、ユーザーの要求に対するシステムの … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS, eess.SP | Is one brick enough to break the wall of spoken dialogue state tracking? はコメントを受け付けていません

Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)

要約 Explainable AI for the Arts (XAIxArts … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.MM, cs.SD, eess.AS | Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) はコメントを受け付けていません