eess.AS」カテゴリーアーカイブ

Self-Supervised Frameworks for Speaker Verification via Bootstrapped Positive Sampling

要約 自己学習学習(SSL)の最近の開発は、スピーカー検証(SV)の重要な可能性 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | コメントする

Teaching Audio-Aware Large Language Models What Does Not Hear: Mitigating Hallucinations through Synthesized Negative Samples

要約 オーディオ認識の大規模な言語モデル(ALLMS)の最近の進歩により、オーデ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | コメントする

SSPS: Self-Supervised Positive Sampling for Robust Self-Supervised Speaker Verification

要約 自己学習学習(SSL)は、スピーカー検証(SV)のかなりの進歩をもたらしま … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントする

SAKURA: On the Multi-hop Reasoning of Large Audio-Language Models Based on Speech and Audio Information

要約 大規模なオーディオ言語モデル(LALMS)は、スピーチ、オーディオなどのマ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | コメントする

Granary: Speech Recognition and Translation Dataset in 25 European Languages

要約 マルチタスクと多言語のアプローチは大規模なモデルに利益をもたらしますが、低 … 続きを読む

カテゴリー: cs.CL, eess.AS | コメントする

Contextual Paralinguistic Data Creation for Multi-Modal Speech-LLM: Data Condensation and Spoken QA Generation

要約 現在の音声-LLMは、主に両方の側面をカバーする質問回答(QA)データセッ … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | コメントする

Anti-aliasing of neural distortion effects via model fine tuning

要約 ニューラルネットワークは、近年ギターの歪み効果モデリングで遍在しています。 … 続きを読む

カテゴリー: cs.LG, eess.AS, eess.SP | コメントする

Machine Learning Approaches to Vocal Register Classification in Contemporary Male Pop Music

要約 すべての経験レベルの歌手にとって、技術的なレパートリーを学ぶ際の最も困難な … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | コメントする

Audio Turing Test: Benchmarking the Human-likeness of Large Language Model-based Text-to-Speech Systems in Chinese

要約 大規模な言語モデル(LLMS)の最近の進歩により、テキストからスピーチ(T … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.SD, eess.AS | コメントする

LegoSLM: Connecting LLM with Speech Encoder using CTC Posteriors

要約 最近、大規模な事前訓練を受けた音声エンコーダと大規模な言語モデル(LLM) … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | コメントする