-
最近の投稿
- A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs
- Robo-Troj: Attacking LLM-based Task Planners
- SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey
- Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators
- Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (37106) cs.CL (28087) cs.CV (42847) cs.HC (2837) cs.LG (42044) cs.RO (21987) cs.SY (3355) eess.IV (4990) eess.SY (3347) stat.ML (5498)
「cs.SD」カテゴリーアーカイブ
Decoding EEG Speech Perception with Transformers and VAE-based Data Augmentation
要約 脳波検査 (EEG) などの非侵襲的な脳信号から音声を解読することは、音声 … 続きを読む
Improving Zero-Shot Chinese-English Code-Switching ASR with kNN-CTC and Gated Monolingual Datastores
要約 kNN-CTC モデルは、単言語自動音声認識 (ASR) に有効であること … 続きを読む
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
要約 私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む
Unsupervised Speech Segmentation: A General Approach Using Speech Language Models
要約 この論文では、音声セグメンテーションの教師なしアプローチを紹介します。これ … 続きを読む
Detecting the Undetectable: Assessing the Efficacy of Current Spoof Detection Methods Against Seamless Speech Edits
要約 ニューラル音声編集の進歩により、なりすまし攻撃における悪用に対する懸念が生 … 続きを読む
Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection
要約 音声感情認識 (SER) は、人間とコンピューターの自然な対話が可能な汎用 … 続きを読む
The Faetar Benchmark: Speech Recognition in a Very Under-Resourced Language
要約 Faetar 自動音声認識ベンチマークを紹介します。これは、低リソースの音 … 続きを読む
Apollo: Band-sequence Modeling for High-Quality Audio Restoration
要約 現代社会においてオーディオ復元の重要性はますます高まっています。これは、高 … 続きを読む
Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders
要約 生のオーディオから音符を取得することを目的とした自動音楽転写 (AMT) … 続きを読む