「cs.SD」カテゴリーアーカイブ

A Machine Learning Approach for Denoising and Upsampling HRTFs

投稿日: 2025年4月25日作成者: jarxiv

要約現実的な仮想没入型オーディオの需要は成長し続け、ヘッド関連の転送関数（HR … 続きを読む →

カテゴリー: cs.LG, cs.SD | コメントを受け付けていません

Unleashing the Power of Natural Audio Featuring Multiple Sound Sources

投稿日: 2025年4月25日作成者: jarxiv

要約ユニバーサルサウンドセパレーションは、混合オーディオからの明確なイベントに … 続きを読む →

カテゴリー: cs.LG, cs.SD | コメントを受け付けていません

Insect-Computer Hybrid Speaker: Speaker using Chirp of the Cicada Controlled by Electrical Muscle Stimulation

投稿日: 2025年4月24日作成者: jarxiv

要約「昆虫コンピューターハイブリッドスピーカー」を提案します。これにより、コン … 続きを読む →

カテゴリー: cs.AR, cs.ET, cs.HC, cs.RO, cs.SD | コメントを受け付けていません

AudioX: Diffusion Transformer for Anything-to-Audio Generation

投稿日: 2025年4月24日作成者: jarxiv

要約オーディオと音楽の生成は、多くのアプリケーションで重要なタスクとして浮上し … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

VocalNet: Speech LLM with Multi-Token Prediction for Faster and High-Quality Generation

投稿日: 2025年4月23日作成者: jarxiv

要約音声大規模な言語モデル（LLM）は、音声処理における顕著な研究の焦点として … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

投稿日: 2025年4月23日作成者: jarxiv

要約このホワイトペーパーでは、オーディオデータとビデオデータの両方を活用して、 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Histogram-based Parameter-efficient Tuning for Passive Sonar Classification

投稿日: 2025年4月23日作成者: jarxiv

要約パラメーター効率の高い転送学習（PETL）メソッドは、モデル全体を微調整す … 続きを読む →

カテゴリー: cs.LG, cs.SD | コメントを受け付けていません

Histogram-based Parameter-efficient Tuning for Passive Sonar Classification

投稿日: 2025年4月22日作成者: jarxiv

要約パラメーター効率の高い転送学習（PETL）メソッドは、モデル全体を微調整す … 続きを読む →

カテゴリー: cs.LG, cs.SD | コメントを受け付けていません

DRAGON: Distributional Rewards Optimize Diffusion Generative Models

投稿日: 2025年4月22日作成者: jarxiv

要約微調整されたメディア生成モデルの希望の結果に向けて、生成最適化（Drago … 続きを読む →

カテゴリー: cs.LG, cs.SD | コメントを受け付けていません

MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders

投稿日: 2025年4月22日作成者: jarxiv

要約大規模な言語モデル（LLMS）の急速な進歩は、自然言語処理能力を大幅に強化 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

A Machine Learning Approach for Denoising and Upsampling HRTFs

Unleashing the Power of Natural Audio Featuring Multiple Sound Sources

Insect-Computer Hybrid Speaker: Speaker using Chirp of the Cicada Controlled by Electrical Muscle Stimulation

AudioX: Diffusion Transformer for Anything-to-Audio Generation

VocalNet: Speech LLM with Multi-Token Prediction for Faster and High-Quality Generation

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Histogram-based Parameter-efficient Tuning for Passive Sonar Classification

Histogram-based Parameter-efficient Tuning for Passive Sonar Classification

DRAGON: Distributional Rewards Optimize Diffusion Generative Models

MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders

最近の投稿

最近のコメント

アーカイブ

カテゴリー