「eess.AS」カテゴリーアーカイブ

Leveraging Spatial Cues from Cochlear Implant Microphones to Efficiently Enhance Speech Separation in Real-World Listening Scenes

投稿日: 2025年1月27日作成者: jarxiv

要約シングルチャネルの音声分離アプローチ、乾燥音声混合物は大幅に改善されました … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain

投稿日: 2025年1月24日作成者: jarxiv

要約音声ディープフェイク検出 (ADD) モデルに説明を追加すると、意思決定プ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Musical ethnocentrism in Large Language Models

投稿日: 2025年1月24日作成者: jarxiv

要約大規模言語モデル (LLM) は、トレーニングデータのバイアス、ひいては … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak

投稿日: 2025年1月24日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Exploring Finetuned Audio-LLM on Heart Murmur Features

投稿日: 2025年1月24日作成者: jarxiv

要約オーディオの大規模言語モデル (LLM) は、人間の音声、音楽、環境音の認 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Performance evaluation of SLAM-ASR: The Good, the Bad, the Ugly, and the Way Forward

投稿日: 2025年1月23日作成者: jarxiv

要約最近の研究では、音声基盤エンコーダと大規模言語モデル (LLM) の間の線 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks

投稿日: 2025年1月23日作成者: jarxiv

要約この論文では、テーブルトップロールプレイングゲーム (TRPG) の … 続きを読む →

カテゴリー: cs.AI, cs.MM, cs.NE, cs.SD, eess.AS | コメントを受け付けていません

FlanEC: Exploring Flan-T5 for Post-ASR Error Correction

投稿日: 2025年1月23日作成者: jarxiv

要約この論文では、自動音声認識 (ASR) 後の生成音声誤り訂正 (GenSE … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Audio Array-Based 3D UAV Trajectory Estimation with LiDAR Pseudo-Labeling

投稿日: 2025年1月22日作成者: jarxiv

要約小型無人航空機 (UAV) の普及が進むにつれ、公共の安全とプライバシーへ … 続きを読む →

カテゴリー: cs.RO, cs.SD, eess.AS | コメントを受け付けていません

Audio Texture Manipulation by Exemplar-Based Analogy

投稿日: 2025年1月22日作成者: jarxiv

要約オーディオテクスチャの操作には、聴覚要素の追加、削除、置換などの特定の変 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Leveraging Spatial Cues from Cochlear Implant Microphones to Efficiently Enhance Speech Separation in Real-World Listening Scenes

What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain

Musical ethnocentrism in Large Language Models

Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak

Exploring Finetuned Audio-LLM on Heart Murmur Features

Performance evaluation of SLAM-ASR: The Good, the Bad, the Ugly, and the Way Forward

Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks

FlanEC: Exploring Flan-T5 for Post-ASR Error Correction

Audio Array-Based 3D UAV Trajectory Estimation with LiDAR Pseudo-Labeling

Audio Texture Manipulation by Exemplar-Based Analogy

最近の投稿

最近のコメント

アーカイブ

カテゴリー