「cs.SD」カテゴリーアーカイブ

The Sounds of Home: A Speech-Removed Residential Audio Dataset for Sound Event Detection

投稿日: 2024年9月18日作成者: jarxiv

要約この論文では、高齢者の幸福を促進することを目的としたスマートホームアプ … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Wave-U-Mamba: An End-To-End Framework For High-Quality And Efficient Speech Super Resolution

投稿日: 2024年9月18日作成者: jarxiv

要約音声超解像度 (SSR) は、失われた高周波成分を復元することによって、低 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Towards Supervised Performance on Speaker Verification with Self-Supervised Learning by Leveraging Large-Scale ASR Models

投稿日: 2024年9月17日作成者: jarxiv

要約自己教師あり学習 (SSL) の最近の進歩により、話者検証 (SV) にお … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Low-Resourced Speech Recognition for Iu Mien Language via Weakly-Supervised Phoneme-based Multilingual Pre-training

投稿日: 2024年9月17日作成者: jarxiv

要約主流の自動音声認識 (ASR) テクノロジーでは、通常、数百時間から数千時 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Self-Supervised Syllable Discovery Based on Speaker-Disentangled HuBERT

投稿日: 2024年9月17日作成者: jarxiv

要約自己教師付き音声表現学習は、転写されていない音声から意味のある特徴を抽出す … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Meta-Whisper: Speech-Based Meta-ICL for ASR on Low-Resource Languages

投稿日: 2024年9月17日作成者: jarxiv

要約この論文では、Whisper モデルを使用して低リソース言語の自動音声認識 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Do Prompts Really Prompt? Exploring the Prompt Understanding Capability of Whisper

投稿日: 2024年9月17日作成者: jarxiv

要約この研究では、プロンプトの情報が高性能音声認識モデル Whisper とど … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

DreamHead: Learning Spatial-Temporal Correspondence via Hierarchical Diffusion for Audio-driven Talking Head Synthesis

投稿日: 2024年9月17日作成者: jarxiv

要約オーディオ駆動トーキングヘッド合成は、提供されたオーディオから本物のよう … 続きを読む →

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

MusicLIME: Explainable Multimodal Music Understanding

投稿日: 2024年9月17日作成者: jarxiv

要約マルチモーダルモデルは、オーディオと歌詞の間の複雑な相互作用を捉えるため … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

An Efficient Self-Learning Framework For Interactive Spoken Dialog Systems

投稿日: 2024年9月17日作成者: jarxiv

要約音声アシスタントなどの対話システムは、複雑で進化する会話にユーザーと関わる … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

The Sounds of Home: A Speech-Removed Residential Audio Dataset for Sound Event Detection

Wave-U-Mamba: An End-To-End Framework For High-Quality And Efficient Speech Super Resolution

Towards Supervised Performance on Speaker Verification with Self-Supervised Learning by Leveraging Large-Scale ASR Models

Low-Resourced Speech Recognition for Iu Mien Language via Weakly-Supervised Phoneme-based Multilingual Pre-training

Self-Supervised Syllable Discovery Based on Speaker-Disentangled HuBERT

Meta-Whisper: Speech-Based Meta-ICL for ASR on Low-Resource Languages

Do Prompts Really Prompt? Exploring the Prompt Understanding Capability of Whisper

DreamHead: Learning Spatial-Temporal Correspondence via Hierarchical Diffusion for Audio-driven Talking Head Synthesis

MusicLIME: Explainable Multimodal Music Understanding

An Efficient Self-Learning Framework For Interactive Spoken Dialog Systems

最近の投稿

最近のコメント

アーカイブ

カテゴリー