-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-To-Speech
要約 この論文では、テキスト音声合成 (TTS) モデルのための大規模な多言語音 … 続きを読む
Cascading and Direct Approaches to Unsupervised Constituency Parsing on Spoken Sentences
要約 教師なし構文解析に関する過去の作業は、記述された形式に限定されています。 … 続きを読む
Leveraging Pretrained Representations with Task-related Keywords for Alzheimer’s Disease Detection
要約 世界人口の急速な高齢化に伴い、アルツハイマー病 (AD) は特に高齢者に顕 … 続きを読む
A Hierarchical Regression Chain Framework for Affective Vocal Burst Recognition
要約 非言語発声による感情シグナリングの一般的な方法として、ボーカル バースト … 続きを読む
I3D: Transformer architectures with input-dependent dynamic depth for speech recognition
要約 Transformer ベースのエンドツーエンドの音声認識は、大きな成功を … 続きを読む
Cross-lingual Alzheimer’s Disease detection based on paralinguistic and pre-trained features
要約 ICASSP-SPGC-2023 ADReSS-M チャレンジ タスクへの … 続きを読む
QI-TTS: Questioning Intonation Control for Emotional Speech Synthesis
要約 最近の表現力豊かなテキスト読み上げ (TTS) モデルは、感情的なスピーチ … 続きを読む
Dynamic Alignment Mask CTC: Improved Mask-CTC with Aligned Cross Entropy
要約 すべてのターゲット トークンを並行して予測するため、非自己回帰モデルは、従 … 続きを読む
Improving CTC-based ASR Models with Gated Interlayer Collaboration
要約 通常、外部言語モデルを使用しない CTC ベースの自動音声認識 (ASR) … 続きを読む
Good Neighbors Are All You Need for Chinese Grapheme-to-Phoneme Conversion
要約 ほとんどの中国語の書記素から音素 (G2P) システムは、最初に入力シーケ … 続きを読む