eess.AS」カテゴリーアーカイブ

LUCY: Linguistic Understanding and Control Yielding Early Stage of Her

要約 彼女の映画は、人間の発話において言語的および麻痺性情報の両方を理解し、自然 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LUCY: Linguistic Understanding and Control Yielding Early Stage of Her はコメントを受け付けていません

Leveraging Spatial Cues from Cochlear Implant Microphones to Efficiently Enhance Speech Separation in Real-World Listening Scenes

要約 シングルチャネルの音声分離アプローチ、乾燥音声混合物は大幅に改善されました … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Leveraging Spatial Cues from Cochlear Implant Microphones to Efficiently Enhance Speech Separation in Real-World Listening Scenes はコメントを受け付けていません

What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain

要約 音声ディープフェイク検出 (ADD) モデルに説明を追加すると、意思決定プ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain はコメントを受け付けていません

Musical ethnocentrism in Large Language Models

要約 大規模言語モデル (LLM) は、トレーニング データのバイアス、ひいては … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Musical ethnocentrism in Large Language Models はコメントを受け付けていません

Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak

要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak はコメントを受け付けていません

Exploring Finetuned Audio-LLM on Heart Murmur Features

要約 オーディオの大規模言語モデル (LLM) は、人間の音声、音楽、環境音の認 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Exploring Finetuned Audio-LLM on Heart Murmur Features はコメントを受け付けていません

Performance evaluation of SLAM-ASR: The Good, the Bad, the Ugly, and the Way Forward

要約 最近の研究では、音声基盤エンコーダと大規模言語モデル (LLM) の間の線 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Performance evaluation of SLAM-ASR: The Good, the Bad, the Ugly, and the Way Forward はコメントを受け付けていません

Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks

要約 この論文では、テーブルトップ ロール プレイング ゲーム (TRPG) の … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.NE, cs.SD, eess.AS | Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks はコメントを受け付けていません

FlanEC: Exploring Flan-T5 for Post-ASR Error Correction

要約 この論文では、自動音声認識 (ASR) 後の生成音声誤り訂正 (GenSE … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | FlanEC: Exploring Flan-T5 for Post-ASR Error Correction はコメントを受け付けていません

Audio Array-Based 3D UAV Trajectory Estimation with LiDAR Pseudo-Labeling

要約 小型無人航空機 (UAV) の普及が進むにつれ、公共の安全とプライバシーへ … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | Audio Array-Based 3D UAV Trajectory Estimation with LiDAR Pseudo-Labeling はコメントを受け付けていません