-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「eess.AS」カテゴリーアーカイブ
Understanding Self-Supervised Learning of Speech Representation via Invariance and Redundancy Reduction
要約 自己教師あり学習 (SSL) は、ラベルのないデータから柔軟な音声表現を学 … 続きを読む
Timbre-Trap: A Low-Resource Framework for Instrument-Agnostic Music Transcription
要約 近年、音楽転写に関する研究は、主にアーキテクチャ設計と楽器固有のデータ取得 … 続きを読む
Voxtlm: unified decoder-only models for consolidating speech recognition/synthesis and speech/text continuation tasks
要約 我々は、音声認識、音声合成、テキスト生成、音声継続という 4 つのタスクを … 続きを読む
MF-AED-AEC: Speech Emotion Recognition by Leveraging Multimodal Fusion, ASR Error Detection, and ASR Error Correction
要約 音声感情認識 (SER) における一般的なアプローチには、音声情報とテキス … 続きを読む
PromptASR for contextualized ASR with controllable style
要約 プロンプトは、トピックや論理的関係などのコンテキスト情報を提供するため、大 … 続きを読む
SpeechDPR: End-to-End Spoken Passage Retrieval for Open-Domain Spoken Question Answering
要約 音声質問応答 (SQA) は、マシンが特定の音声パッセージ内の回答範囲を見 … 続きを読む
SpeechGPT-Gen: Scaling Chain-of-Information Speech Generation
要約 効果的な音声モデリングの恩恵を受けて、現在の音声大規模言語モデル (SLL … 続きを読む
Expressive Acoustic Guitar Sound Synthesis with an Instrument-Specific Input Representation and Diffusion Outpainting
要約 演奏用のギターサウンドを合成することは、同時発音数が多く表現の多様性が大き … 続きを読む
Non-Intrusive Speech Intelligibility Prediction for Hearing-Impaired Users using Intermediate ASR Features and Human Memory Models
要約 ニューラル ネットワークは、非侵入的な音声明瞭度の予測に使用されて成功して … 続きを読む
Multilingual and Fully Non-Autoregressive ASR with Large Language Model Fusion: A Comprehensive Study
要約 大規模モデルの時代では、デコードの自己回帰的な性質により、レイテンシーが重 … 続きを読む