-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
End-to-end Spoken Language Understanding with Tree-constrained Pointer Generator
要約 エンド ツー エンドの音声言語理解 (SLU) には、ロングテール ワード … 続きを読む
Chat with the Environment: Interactive Multimodal Perception using Large Language Models
要約 複雑な世界でロボットの動作をプログラミングするには、器用な低レベルのスキル … 続きを読む
Cross-speaker Emotion Transfer by Manipulating Speech Style Latents
要約 近年、感情的なテキスト読み上げはかなりの進歩を遂げています。 ただし、大量 … 続きを読む
Once-for-All Sequence Compression for Self-Supervised Speech Models
要約 時間軸に沿ったシーケンスの長さは、多くの場合、音声処理における計算の支配的 … 続きを読む
Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-To-Speech
要約 この論文では、テキスト音声合成 (TTS) モデルのための大規模な多言語音 … 続きを読む
Cascading and Direct Approaches to Unsupervised Constituency Parsing on Spoken Sentences
要約 教師なし構文解析に関する過去の作業は、記述された形式に限定されています。 … 続きを読む
Leveraging Pretrained Representations with Task-related Keywords for Alzheimer’s Disease Detection
要約 世界人口の急速な高齢化に伴い、アルツハイマー病 (AD) は特に高齢者に顕 … 続きを読む
A Hierarchical Regression Chain Framework for Affective Vocal Burst Recognition
要約 非言語発声による感情シグナリングの一般的な方法として、ボーカル バースト … 続きを読む
I3D: Transformer architectures with input-dependent dynamic depth for speech recognition
要約 Transformer ベースのエンドツーエンドの音声認識は、大きな成功を … 続きを読む
Cross-lingual Alzheimer’s Disease detection based on paralinguistic and pre-trained features
要約 ICASSP-SPGC-2023 ADReSS-M チャレンジ タスクへの … 続きを読む