-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「eess.AS」カテゴリーアーカイブ
Data-driven grapheme-to-phoneme representations for a lexicon-free text-to-speech
要約 Grapheme-to-Phoneme (G2P) は、最新の高品質 Te … 続きを読む
Multilingual acoustic word embeddings for zero-resource languages
要約 この研究は、ラベル付きデータのないゼロリソース言語向けの音声アプリケーショ … 続きを読む
Attentive Fusion: A Transformer-based Approach to Multimodal Hate Speech Detection
要約 最近のソーシャル メディアの使用量の急増と急激な増加に伴い、ソーシャル メ … 続きを読む
Developing an AI-based Integrated System for Bee Health Evaluation
要約 ミツバチは世界の食料供給量の約3分の1を受粉しているが、農薬や害虫などのい … 続きを読む
On the Audio Hallucinations in Large Audio-Video Language Models
要約 大規模なオーディオビデオ言語モデルは、ビデオとオーディオの両方の説明を生成 … 続きを読む
Towards Hierarchical Spoken Language Dysfluency Modeling
要約 音声流暢性モデリングは、言語療法と言語学習の両方のボトルネックです。 しか … 続きを読む
Communication-Efficient Personalized Federated Learning for Speech-to-Text Tasks
要約 プライバシーを保護し、法的規制を満たすために、自動音声認識 (ASR) や … 続きを読む
Attention-Based Recurrent Neural Network For Automatic Behavior Laying Hen Recognition
要約 現代の養鶏の関心の 1 つは、健康行動に関する非常に有益な情報を含む産卵鶏 … 続きを読む
ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech Recognition Challenge
要約 運転シナリオにおける音声処理と認識の研究を促進するために、私たちは ISC … 続きを読む
FreGrad: Lightweight and Fast Frequency-aware Diffusion Vocoder
要約 この論文の目標は、FreGrad という軽量で高速な拡散ベースのボコーダー … 続きを読む