「eess.AS」カテゴリーアーカイブ

Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN

投稿日: 2024年11月22日作成者: jarxiv

要約この論文では、診療所で低コストのシステムを使用して、心臓の異常を高精度かつ … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS, eess.SP | コメントを受け付けていません

Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM

投稿日: 2024年11月21日作成者: jarxiv

要約テキスト読み上げ (TTS) モデルは、テキストのみのコーパスを使用して自 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Predicting User Intents and Musical Attributes from Music Discovery Conversations

投稿日: 2024年11月21日作成者: jarxiv

要約意図分類は、入力テキストクエリからユーザーのニーズを特定するテキスト理解 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

CAFE A Novel Code switching Dataset for Algerian Dialect French and English

投稿日: 2024年11月21日作成者: jarxiv

要約この論文では、アルジェリアの方言、フランス語、および英語の間の最初のコード … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Comparative Analysis of Audio Feature Extraction for Real-Time Talking Portrait Synthesis

投稿日: 2024年11月21日作成者: jarxiv

要約このペーパーでは、リアルタイムアプリケーションで遅延が発生し、応答性が制 … 続きを読む →

カテゴリー: 68T01, 68T07, 68T45, cs.AI, cs.HC, cs.SD, eess.AS | コメントを受け付けていません

Basic syntax from speech: Spontaneous concatenation in unsupervised deep neural networks

投稿日: 2024年11月21日作成者: jarxiv

要約構文の計算モデルは主にテキストベースです。ここで私たちは、構文の進化にお … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Rethinking MUSHRA: Addressing Modern Challenges in Text-to-Speech Evaluation

投稿日: 2024年11月20日作成者: jarxiv

要約 TTS モデルは急速に進歩していますが、一貫した堅牢な人間による評価フレー … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection

投稿日: 2024年11月19日作成者: jarxiv

要約カクテルパーティーでは、人間は注意を向ける驚くべき能力を発揮します。聴覚 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR

投稿日: 2024年11月18日作成者: jarxiv

要約教師なし自動音声認識 (ASR) は、音声とテキストのペアのデータを監視せ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Local deployment of large-scale music AI models on commodity hardware

投稿日: 2024年11月15日作成者: jarxiv

要約私たちは、汎用ハードウェア上でローカルに大規模な生成 AI モデルを使用し … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN

Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM

Predicting User Intents and Musical Attributes from Music Discovery Conversations

CAFE A Novel Code switching Dataset for Algerian Dialect French and English

Comparative Analysis of Audio Feature Extraction for Real-Time Talking Portrait Synthesis

Basic syntax from speech: Spontaneous concatenation in unsupervised deep neural networks

Rethinking MUSHRA: Addressing Modern Challenges in Text-to-Speech Evaluation

DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection

REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR

Local deployment of large-scale music AI models on commodity hardware

最近の投稿

最近のコメント

アーカイブ

カテゴリー