cs.SD」カテゴリーアーカイブ

A Machine Learning Approach for Denoising and Upsampling HRTFs

要約 現実的な仮想没入型オーディオの需要は成長し続け、ヘッド関連の転送関数(HR … 続きを読む

カテゴリー: cs.LG, cs.SD | A Machine Learning Approach for Denoising and Upsampling HRTFs はコメントを受け付けていません

Unleashing the Power of Natural Audio Featuring Multiple Sound Sources

要約 ユニバーサルサウンドセパレーションは、混合オーディオからの明確なイベントに … 続きを読む

カテゴリー: cs.LG, cs.SD | Unleashing the Power of Natural Audio Featuring Multiple Sound Sources はコメントを受け付けていません

Insect-Computer Hybrid Speaker: Speaker using Chirp of the Cicada Controlled by Electrical Muscle Stimulation

要約 「昆虫コンピューターハイブリッドスピーカー」を提案します。これにより、コン … 続きを読む

カテゴリー: cs.AR, cs.ET, cs.HC, cs.RO, cs.SD | Insect-Computer Hybrid Speaker: Speaker using Chirp of the Cicada Controlled by Electrical Muscle Stimulation はコメントを受け付けていません

AudioX: Diffusion Transformer for Anything-to-Audio Generation

要約 オーディオと音楽の生成は、多くのアプリケーションで重要なタスクとして浮上し … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | AudioX: Diffusion Transformer for Anything-to-Audio Generation はコメントを受け付けていません

VocalNet: Speech LLM with Multi-Token Prediction for Faster and High-Quality Generation

要約 音声大規模な言語モデル(LLM)は、音声処理における顕著な研究の焦点として … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | VocalNet: Speech LLM with Multi-Token Prediction for Faster and High-Quality Generation はコメントを受け付けていません

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

要約 このホワイトペーパーでは、オーディオデータとビデオデータの両方を活用して、 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis はコメントを受け付けていません

Histogram-based Parameter-efficient Tuning for Passive Sonar Classification

要約 パラメーター効率の高い転送学習(PETL)メソッドは、モデル全体を微調整す … 続きを読む

カテゴリー: cs.LG, cs.SD | Histogram-based Parameter-efficient Tuning for Passive Sonar Classification はコメントを受け付けていません

Histogram-based Parameter-efficient Tuning for Passive Sonar Classification

要約 パラメーター効率の高い転送学習(PETL)メソッドは、モデル全体を微調整す … 続きを読む

カテゴリー: cs.LG, cs.SD | Histogram-based Parameter-efficient Tuning for Passive Sonar Classification はコメントを受け付けていません

DRAGON: Distributional Rewards Optimize Diffusion Generative Models

要約 微調整されたメディア生成モデルの希望の結果に向けて、生成最適化(Drago … 続きを読む

カテゴリー: cs.LG, cs.SD | DRAGON: Distributional Rewards Optimize Diffusion Generative Models はコメントを受け付けていません

MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders

要約 大規模な言語モデル(LLMS)の急速な進歩は、自然言語処理能力を大幅に強化 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders はコメントを受け付けていません