-
最近の投稿
- Non-Gaited Legged Locomotion with Monte-Carlo Tree Search and Supervised Learning
- Agricultural Industry Initiatives on Autonomy: How collaborative initiatives of VDMA and AEF can facilitate complexity in domain crossing harmonization needs
- Physics-Grounded Differentiable Simulation for Soft Growing Robots
- SLIM: Sim-to-Real Legged Instructive Manipulation via Long-Horizon Visuomotor Learning
- Online Trajectory Replanner for Dynamically Grasping Irregular Objects
-
最近のコメント
表示できるコメントはありません。 cs.AI (32994) cs.CL (24943) cs.CR (2553) cs.CV (39129) cs.LG (37903) cs.RO (19188) cs.SY (2936) eess.IV (4690) eess.SY (2930) stat.ML (4984)
「cs.SD」カテゴリーアーカイブ
Codec Does Matter: Exploring the Semantic Shortcoming of Codec for Audio Language Model
要約 オーディオ生成における最近の進歩は、大規模言語モデル (LLM) の機能に … 続きを読む
AASIST3: KAN-Enhanced AASIST Speech Deepfake Detection using SSL Features and Additional Regularization for the ASVspoof 2024 Challenge
要約 音声の特徴に基づいて話者を識別する自動話者認証 (ASV) システムは、金 … 続きを読む
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
要約 言語モデルの最近の進歩は大幅な進歩を遂げています。 GPT-4o は新たな … 続きを読む
Towards Efficient Modelling of String Dynamics: A Comparison of State Space and Koopman based Deep Learning Methods
要約 この論文では、線形および非線形の両方の硬いストリングのダイナミクスをモデル … 続きを読む
カテゴリー: cs.LG, cs.SD, eess.AS, physics.comp-ph
Towards Efficient Modelling of String Dynamics: A Comparison of State Space and Koopman based Deep Learning Methods はコメントを受け付けていません
Measuring the Accuracy of Automatic Speech Recognition Solutions
要約 聴覚障害者および聴覚障害者 (DHH) の人々にとって、キャプションは不可 … 続きを読む
SALSA: Speedy ASR-LLM Synchronous Aggregation
要約 事前トレーニングされた LLM を利用して、特に低リソース言語の ASR … 続きを読む
Innovative Speech-Based Deep Learning Approaches for Parkinson’s Disease Classification: A Systematic Review
要約 パーキンソン病 (PD) は世界で 2 番目に蔓延している神経変性疾患であ … 続きを読む
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
要約 言語モデルの最近の進歩は大幅な進歩を遂げています。 GPT-4o は新たな … 続きを読む
Easy, Interpretable, Effective: openSMILE for voice deepfake detection
要約 この論文では、音声の信頼性とディープフェイク検出の分野における事実上の標準 … 続きを読む
Multi-modal Adversarial Training for Zero-Shot Voice Cloning
要約 与えられたテキストから音声を再構築するようにトレーニングされたテキスト読み … 続きを読む