cs.SD」カテゴリーアーカイブ

SSPS: Self-Supervised Positive Sampling for Robust Self-Supervised Speaker Verification

要約 自己学習学習(SSL)は、スピーカー検証(SV)のかなりの進歩をもたらしま … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | SSPS: Self-Supervised Positive Sampling for Robust Self-Supervised Speaker Verification はコメントを受け付けていません

SAKURA: On the Multi-hop Reasoning of Large Audio-Language Models Based on Speech and Audio Information

要約 大規模なオーディオ言語モデル(LALMS)は、スピーチ、オーディオなどのマ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | SAKURA: On the Multi-hop Reasoning of Large Audio-Language Models Based on Speech and Audio Information はコメントを受け付けていません

Machine Learning Approaches to Vocal Register Classification in Contemporary Male Pop Music

要約 すべての経験レベルの歌手にとって、技術的なレパートリーを学ぶ際の最も困難な … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Machine Learning Approaches to Vocal Register Classification in Contemporary Male Pop Music はコメントを受け付けていません

Audio Turing Test: Benchmarking the Human-likeness of Large Language Model-based Text-to-Speech Systems in Chinese

要約 大規模な言語モデル(LLMS)の最近の進歩により、テキストからスピーチ(T … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.SD, eess.AS | Audio Turing Test: Benchmarking the Human-likeness of Large Language Model-based Text-to-Speech Systems in Chinese はコメントを受け付けていません

LegoSLM: Connecting LLM with Speech Encoder using CTC Posteriors

要約 最近、大規模な事前訓練を受けた音声エンコーダと大規模な言語モデル(LLM) … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LegoSLM: Connecting LLM with Speech Encoder using CTC Posteriors はコメントを受け付けていません

ImprovNet — Generating Controllable Musical Improvisations with Iterative Corruption Refinement

要約 Deep Learningがさまざまなドメインにまたがるスタイル転送におけ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | ImprovNet — Generating Controllable Musical Improvisations with Iterative Corruption Refinement はコメントを受け付けていません

On the Role of Speech Data in Reducing Toxicity Detection Bias

要約 テキスト毒性検出システムは、人口統計グループに言及しているサンプルに不均衡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | On the Role of Speech Data in Reducing Toxicity Detection Bias はコメントを受け付けていません

Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization

要約 犬の樹皮を聞いて、駐車した車を見るためだけに音に向かって曲がると想像してく … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization はコメントを受け付けていません

Learning Nonlinear Dynamics in Physical Modelling Synthesis using Neural Ordinary Differential Equations

要約 モーダル合成方法は、分散された音楽システムをモデル化するための長年のアプロ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS, physics.comp-ph | Learning Nonlinear Dynamics in Physical Modelling Synthesis using Neural Ordinary Differential Equations はコメントを受け付けていません

Deconstructing Jazz Piano Style Using Machine Learning

要約 芸術的なスタイルは何世紀にもわたって研究されてきましたが、機械学習の最近の … 続きを読む

カテゴリー: cs.IR, cs.LG, cs.SD, eess.AS | Deconstructing Jazz Piano Style Using Machine Learning はコメントを受け付けていません