cs.SD」カテゴリーアーカイブ

Predicting User Intents and Musical Attributes from Music Discovery Conversations

要約 意図分類は、入力テキスト クエリからユーザーのニーズを特定するテキスト理解 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Predicting User Intents and Musical Attributes from Music Discovery Conversations はコメントを受け付けていません

CAFE A Novel Code switching Dataset for Algerian Dialect French and English

要約 この論文では、アルジェリアの方言、フランス語、および英語の間の最初のコード … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | CAFE A Novel Code switching Dataset for Algerian Dialect French and English はコメントを受け付けていません

Comparative Analysis of Audio Feature Extraction for Real-Time Talking Portrait Synthesis

要約 このペーパーでは、リアルタイム アプリケーションで遅延が発生し、応答性が制 … 続きを読む

カテゴリー: 68T01, 68T07, 68T45, cs.AI, cs.HC, cs.SD, eess.AS | Comparative Analysis of Audio Feature Extraction for Real-Time Talking Portrait Synthesis はコメントを受け付けていません

Basic syntax from speech: Spontaneous concatenation in unsupervised deep neural networks

要約 構文の計算モデルは主にテキストベースです。 ここで私たちは、構文の進化にお … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Basic syntax from speech: Spontaneous concatenation in unsupervised deep neural networks はコメントを受け付けていません

Rethinking MUSHRA: Addressing Modern Challenges in Text-to-Speech Evaluation

要約 TTS モデルは急速に進歩していますが、一貫した堅牢な人間による評価フレー … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Rethinking MUSHRA: Addressing Modern Challenges in Text-to-Speech Evaluation はコメントを受け付けていません

DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection

要約 カクテルパーティーでは、人間は注意を向ける驚くべき能力を発揮します。 聴覚 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection はコメントを受け付けていません

REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR

要約 教師なし自動音声認識 (ASR) は、音声とテキストのペアのデータを監視せ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR はコメントを受け付けていません

Local deployment of large-scale music AI models on commodity hardware

要約 私たちは、汎用ハードウェア上でローカルに大規模な生成 AI モデルを使用し … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Local deployment of large-scale music AI models on commodity hardware はコメントを受け付けていません

Re-Parameterization of Lightweight Transformer for On-Device Speech Emotion Recognition

要約 エッジまたはモノのインターネット (IoT) デバイスでの機械学習モデルの … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Re-Parameterization of Lightweight Transformer for On-Device Speech Emotion Recognition はコメントを受け付けていません

A Comparative Study of Discrete Speech Tokens for Semantic-Related Tasks with Large Language Models

要約 Speech Large Language Model (Speech L … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | A Comparative Study of Discrete Speech Tokens for Semantic-Related Tasks with Large Language Models はコメントを受け付けていません