-
最近の投稿
- Geofenced Unmanned Aerial Robotic Defender for Deer Detection and Deterrence (GUARD)
- mmMirror: Device Free mmWave Indoor NLoS Localization Using Van-Atta-Array IRS
- Fast and Robust Localization for Humanoid Soccer Robot via Iterative Landmark Matching
- Robust 2D lidar-based SLAM in arboreal environments without IMU/GNSS
- REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?
-
最近のコメント
表示できるコメントはありません。 cs.AI (38249) cs.CL (28902) cs.CV (43799) cs.HC (2925) cs.LG (43179) cs.RO (22772) cs.SY (3498) eess.IV (5073) eess.SY (3490) stat.ML (5619)
「cs.SD」カテゴリーアーカイブ
Sine, Transient, Noise Neural Modeling of Piano Notes
要約 この論文では、ピアノサウンドをエミュレートするための新しい方法を紹介します … 続きを読む
SPMamba: State-space model is all you need in speech separation
要約 既存の CNN ベースの音声分離モデルは、局所的な受容野の制限に直面してお … 続きを読む
MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders
要約 大規模言語モデル (LLM) の急速な進歩により、自然言語処理機能が大幅に … 続きを読む
LLaMA-Omni: Seamless Speech Interaction with Large Language Models
要約 GPT-4o のようなモデルは、音声による大規模言語モデル (LLM) と … 続きを読む
Benchmarking Sub-Genre Classification For Mainstage Dance Music
要約 音楽の分類は、幅広い用途に対応しており、音楽情報の検索において最も重要なタ … 続きを読む
IndicVoices-R: Unlocking a Massive Multilingual Multi-speaker Speech Corpus for Scaling Indian TTS
要約 Text-to-Speech (TTS) 合成の最近の進歩により、広範な … 続きを読む
Harmonic Reasoning in Large Language Models
要約 大規模言語モデル (LLM) は非常に人気があり、芸術における創造的なタス … 続きを読む
PDAF: A Phonetic Debiasing Attention Framework For Speaker Verification
要約 話者認証システムは、音声による身元認証に不可欠です。 従来、これらのシステ … 続きを読む
Evaluation of real-time transcriptions using end-to-end ASR models
要約 自動音声認識 (ASR) または Speech-to-text (STT) … 続きを読む