-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「eess.AS」カテゴリーアーカイブ
Toward A Reinforcement-Learning-Based System for Adjusting Medication to Minimize Speech Disfluency
要約 私たちは強化学習ベースのシステムを提案します。このシステムは、メンタルヘル … 続きを読む
Efficient Multiscale Multimodal Bottleneck Transformer for Audio-Video Classification
要約 近年、研究者は音声信号とビデオ信号の両方を組み合わせて、アクションが視覚的 … 続きを読む
Towards ASR Robust Spoken Language Understanding Through In-Context Learning With Word Confusion Networks
要約 音声言語理解 (SLU) の分野では、従来の書き言葉の代わりに音声を書き起 … 続きを読む
Retrieval-Augmented Text-to-Audio Generation
要約 Text-to-Audio (TTA) 生成における最近の進歩にも関わらず … 続きを読む
Pheme: Efficient and Conversational Speech Generation
要約 近年、音声生成は目覚ましい進歩を遂げており、実際の人間の声とほとんど区別で … 続きを読む
Direction of Arrival Estimation Using Microphone Array Processing for Moving Humanoid Robots
要約 人型ロボットの聴覚システムは、近年ますます注目を集めています。 このシステ … 続きを読む
PEFT for Speech: Unveiling Optimal Placement, Merging Strategies, and Ensemble Techniques
要約 PEFT(Parameter-Efficient Fine-Tuning) … 続きを読む
Task Oriented Dialogue as a Catalyst for Self-Supervised Automatic Speech Recognition
要約 自動音声認識(ASR)システムの単語エラー率は一貫して低下しているが、AS … 続きを読む
Let There Be Sound: Reconstructing High Quality Speech from Silent Videos
要約 この研究の目標は、唇の動きのみから高品質の音声を再構成することであり、この … 続きを読む
Perceptual Musical Features for Interpretable Audio Tagging
要約 音楽ストリーミングプラットフォームの時代において、音楽音声に自動的にタグを … 続きを読む