-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「eess.AS」カテゴリーアーカイブ
ParrotTTS: Text-to-Speech synthesis by exploiting self-supervised representations
要約 我々は、もつれを解いた自己教師あり音声表現を活用したモジュール化されたテキ … 続きを読む
Zero Resource Code-switched Speech Benchmark Using Speech Utterance Pairs For Multiple Spoken Languages
要約 自己監視型音声エンコーダのコードスイッチング機能を直接評価するために設計さ … 続きを読む
Audio Generation with Multiple Conditional Diffusion Model
要約 テキストベースのオーディオ生成モデルには、オーディオ内のすべての情報を網羅 … 続きを読む
StyleSinger: Style Transfer for Out-Of-Domain Singing Voice Synthesis
要約 ドメイン外 (OOD) 歌声合成 (SVS) のためのスタイル転送は、リフ … 続きを読む
Exploring Sound vs Vibration for Robust Fault Detection on Rotating Machinery
要約 回転機械の故障を堅牢かつリアルタイムで検出することは、さまざまな業界におけ … 続きを読む
Understanding Probe Behaviors through Variational Bounds of Mutual Information
要約 自己教師あり表現の成功により、研究者は表現内にカプセル化された情報をより深 … 続きを読む
CIF-T: A Novel CIF-based Transducer Architecture for Automatic Speech Recognition
要約 RNN-T モデルは ASR で広く使用されており、RNN-T 損失に依存 … 続きを読む
IR-UWB Radar-Based Contactless Silent Speech Recognition of Vowels, Consonants, Words, and Phrases
要約 無声音声認識 (SSR) については、いくつかのセンシング技術が提案されて … 続きを読む
Phoneme-aware Encoding for Prefix-tree-based Contextual ASR
要約 音声認識アプリケーションでは、固有名詞などの文脈固有の珍しい単語を認識する … 続きを読む
Leveraging Language ID to Calculate Intermediate CTC Loss for Enhanced Code-Switching Speech Recognition
要約 近年、エンドツーエンドの音声認識は、従来の自動音声認識モデルの音響、発音辞 … 続きを読む