-
最近の投稿
- Non-Gaited Legged Locomotion with Monte-Carlo Tree Search and Supervised Learning
- Agricultural Industry Initiatives on Autonomy: How collaborative initiatives of VDMA and AEF can facilitate complexity in domain crossing harmonization needs
- Physics-Grounded Differentiable Simulation for Soft Growing Robots
- SLIM: Sim-to-Real Legged Instructive Manipulation via Long-Horizon Visuomotor Learning
- Online Trajectory Replanner for Dynamically Grasping Irregular Objects
-
最近のコメント
表示できるコメントはありません。 cs.AI (32994) cs.CL (24943) cs.CR (2553) cs.CV (39129) cs.LG (37903) cs.RO (19188) cs.SY (2936) eess.IV (4690) eess.SY (2930) stat.ML (4984)
「cs.SD」カテゴリーアーカイブ
Harmonic Reasoning in Large Language Models
要約 大規模言語モデル (LLM) は非常に人気があり、芸術における創造的なタス … 続きを読む
PDAF: A Phonetic Debiasing Attention Framework For Speaker Verification
要約 話者認証システムは、音声による身元認証に不可欠です。 従来、これらのシステ … 続きを読む
Evaluation of real-time transcriptions using end-to-end ASR models
要約 自動音声認識 (ASR) または Speech-to-text (STT) … 続きを読む
Auto-ACD: A Large-scale Dataset for Audio-Language Representation Learning
要約 最近、AI コミュニティは、大規模なマルチモーダル データセットを活用した … 続きを読む
Innovative Speech-Based Deep Learning Approaches for Parkinson’s Disease Classification: A Systematic Review
要約 パーキンソン病 (PD) は世界で 2 番目に蔓延している神経変性疾患であ … 続きを読む
Enhancing Code-Switching Speech Recognition with LID-Based Collaborative Mixture of Experts Model
要約 異なる言語間の音声の類似性をモデル化することは本質的に難しいため、コードス … 続きを読む
LAST: Language Model Aware Speech Tokenization
要約 音声トークン化は音声言語モデル (LM) の基礎として機能し、音声言語モデ … 続きを読む
Raw Speech Enhancement with Deep State Space Modeling
要約 エンドツーエンド方式でオンラインの生の音声を効率的に強化するために構成され … 続きを読む
Temporal Order Preserved Optimal Transport-based Cross-modal Knowledge Transfer Learning for ASR
要約 言語知識を事前学習済み言語モデル (PLM) から音響モデルに転送すると、 … 続きを読む
Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Cord Paralysis
要約 この論文では、音声データとビデオ データを組み合わせて、臨床評価のために喉 … 続きを読む