-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「eess.AS」カテゴリーアーカイブ
HEAR: Hearing Enhanced Audio Response for Video-grounded Dialogue
要約 Video-grounded Dialogue (VGD) は、ビデオ、オ … 続きを読む
Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder
要約 認知症の診断には一連の異なる検査方法が必要ですが、これは複雑で時間がかかり … 続きを読む
Generative Context-aware Fine-tuning of Self-supervised Speech Models
要約 特定の発話に対する自動音声認識や話し言葉の理解などのタスクを実行する場合、 … 続きを読む
STaR: Distilling Speech Temporal Relation for Lightweight Speech Self-Supervised Learning Models
要約 Transformer ベースの音声自己教師あり学習 (SSL) モデルは … 続きを読む
SER_AMPEL: a multi-source dataset for speech emotion recognition of Italian older adults
要約 この論文では、音声感情認識 (SER) 用のマルチソース データセットであ … 続きを読む
WikiMuTe: A web-sourced dataset of semantic descriptions for music audio
要約 自由形式のテキストと音楽を照合するマルチモーダル深層学習技術は、音楽情報検 … 続きを読む
Design, construction and evaluation of emotional multimodal pathological speech database
要約 利用可能な感情病理学データベースの欠如は、構音障害患者の感情表現状態を研究 … 続きを読む
Reacting like Humans: Incorporating Intrinsic Human Behaviors into NAO through Sound-Based Reactions for Enhanced Sociability
要約 人間に似た反応を組み込むことで、人間の間でのロボットの受容性と社会性を大幅 … 続きを読む
Ultra Low Complexity Deep Learning Based Noise Suppression
要約 この論文では、リソースに制約のあるデバイス上でリアルタイムの音声強調を行う … 続きを読む