eess.AS」カテゴリーアーカイブ

On the Role of Speech Data in Reducing Toxicity Detection Bias

要約 テキスト毒性検出システムは、人口統計グループに言及しているサンプルに不均衡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | On the Role of Speech Data in Reducing Toxicity Detection Bias はコメントを受け付けていません

Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization

要約 犬の樹皮を聞いて、駐車した車を見るためだけに音に向かって曲がると想像してく … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization はコメントを受け付けていません

Learning Nonlinear Dynamics in Physical Modelling Synthesis using Neural Ordinary Differential Equations

要約 モーダル合成方法は、分散された音楽システムをモデル化するための長年のアプロ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS, physics.comp-ph | Learning Nonlinear Dynamics in Physical Modelling Synthesis using Neural Ordinary Differential Equations はコメントを受け付けていません

Deconstructing Jazz Piano Style Using Machine Learning

要約 芸術的なスタイルは何世紀にもわたって研究されてきましたが、機械学習の最近の … 続きを読む

カテゴリー: cs.IR, cs.LG, cs.SD, eess.AS | Deconstructing Jazz Piano Style Using Machine Learning はコメントを受け付けていません

Reinforcement Learning Outperforms Supervised Fine-Tuning: A Case Study on Audio Question Answering

要約 最近、強化学習(RL)は、大規模な言語モデル(LLM)の推論能力を大幅に強 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Reinforcement Learning Outperforms Supervised Fine-Tuning: A Case Study on Audio Question Answering はコメントを受け付けていません

The Voice Timbre Attribute Detection 2025 Challenge Evaluation Plan

要約 声の音色とは、人間の聴覚によって認識されているように、他の人と区別する人の … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | The Voice Timbre Attribute Detection 2025 Challenge Evaluation Plan はコメントを受け付けていません

WavReward: Spoken Dialogue Models With Generalist Reward Evaluators

要約 GPT-4O-Audioなどのエンドツーエンドの音声対話モデルは、最近、音 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | WavReward: Spoken Dialogue Models With Generalist Reward Evaluators はコメントを受け付けていません

UWAV: Uncertainty-weighted Weakly-supervised Audio-Visual Video Parsing

要約 オーディオビジュアルビデオの解析(AVVP)は、両方のユニモーダルイベント … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | UWAV: Uncertainty-weighted Weakly-supervised Audio-Visual Video Parsing はコメントを受け付けていません

A Mamba-based Network for Semi-supervised Singing Melody Extraction Using Confidence Binary Regularization

要約 Singing Melody Extraction(SME)は、音楽情報検 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | A Mamba-based Network for Semi-supervised Singing Melody Extraction Using Confidence Binary Regularization はコメントを受け付けていません

A Survey of Deep Learning for Complex Speech Spectrograms

要約 深い学習の最近の進歩は、特に複雑なスペクトログラムの分析と操作において、音 … 続きを読む

カテゴリー: cs.AI, eess.AS | A Survey of Deep Learning for Complex Speech Spectrograms はコメントを受け付けていません