-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
「cs.SD」カテゴリーアーカイブ
GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Accurate Speech Emotion Recognition
要約 対照的クロスモダリティ事前トレーニングは、最近さまざまな分野で目覚ましい成 … 続きを読む
Spaiche: Extending State-of-the-Art ASR Models to Swiss German Dialects
要約 NLP における最近の進歩により、私たちの日常生活における ASR システ … 続きを読む
Can Whisper perform speech-based in-context learning
要約 この論文では、OpenAI によってリリースされた Whisper 自動音 … 続きを読む
CoMoSpeech: One-Step Speech and Singing Voice Synthesis via Consistency Model
要約 ノイズ除去拡散確率モデル (DDPM) は、音声合成において有望なパフォー … 続きを読む
MASTERKEY: Practical Backdoor Attack Against Speaker Verification Systems
要約 話者認証 (SV) は、音声特性を使用して正当なユーザーを認証するために、 … 続きを読む
Weakly-Supervised Multi-Task Learning for Audio-Visual Speaker Verification
要約 この論文では、オープンセットの視聴覚話者検証用に最適化された堅牢なマルチモ … 続きを読む
Assessing the Generalization Gap of Learning-Based Speech Enhancement Systems in Noisy and Reverberant Environments
要約 雑音と残響のある音声混合物の音響変動は、ターゲット話者と干渉ノイズの分光時 … 続きを読む
RescueSpeech: A German Corpus for Speech Recognition in Search and Rescue Domain
要約 音声認識の最近の進歩にも関わらず、騒がしく残響のある音響環境で会話や感情的 … 続きを読む
LLaSM: Large Language and Speech Model
要約 マルチモーダル大規模言語モデルは、最近大きな関心を集めています。 ただし、 … 続きを読む
Speech Separation based on Contrastive Learning and Deep Modularization
要約 現在のモノラルの最先端の音声分離ツールは教師あり学習に依存しています。 こ … 続きを読む