-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Low latency transformers for speech processing
要約 トランスフォーマーは、最新のニューラル ネットワークで広く使用されているビ … 続きを読む
Cross-Modal Mutual Learning for Cued Speech Recognition
要約 Automatic Cued Speech Recognition (AC … 続きを読む
Dynamic Kernels and Channel Attention for Low Resource Speaker Verification
要約 最先端の話者検証フレームワークは通常、検証パフォーマンスを向上させるために … 続きを読む
Duration-aware pause insertion using pre-trained language model for multi-speaker text-to-speech
要約 一時停止の挿入は、フレーズ区切り予測およびフレージングとも呼ばれ、TTS … 続きを読む
Using Auxiliary Tasks In Multimodal Fusion Of Wav2vec 2.0 And BERT For Multimodal Emotion Recognition
要約 データの欠如とマルチモーダル融合の難しさは、マルチモーダル感情認識 (ME … 続きを読む
Analysing Discrete Self Supervised Speech Representation for Spoken Language Modeling
要約 この作業は、Generative Spoken Language Mode … 続きを読む
MoLE : Mixture of Language Experts for Multi-Lingual Automatic Speech Recognition
要約 多言語音声認識は、異なる言語の言語表現を区別し、同時に音響処理を統合するこ … 続きを読む
Multimodal Speech Recognition for Language-Guided Embodied Agents
要約 言語ガイド付きの具体化されたエージェントのベンチマークは通常、テキストベー … 続きを読む
Text-only domain adaptation for end-to-end ASR using integrated text-to-mel-spectrogram generator
要約 転写された音声データ、テキスト データ、または両方の混合でトレーニングでき … 続きを読む
A Comparative Analysis Of Latent Regressor Losses For Singing Voice Conversion
要約 以前の研究では、話し声変換 (VC) の確立された手法は、歌声変換 (SV … 続きを読む