-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Leveraging Data Collection and Unsupervised Learning for Code-switched Tunisian Arabic Automatic Speech Recognition
要約 方言に対する効果的な自動音声認識 (ASR) ソリューションを作成するには … 続きを読む
Incremental Blockwise Beam Search for Simultaneous Speech Translation with Controllable Quality-Latency Tradeoff
要約 ブロック単位のセルフアテンション エンコーダ モデルは、同時音声翻訳に対す … 続きを読む
Long-Form End-to-End Speech Translation via Latent Alignment Segmentation
要約 現在の同時音声翻訳モデルは、最大数秒の音声しか処理できません。 現代のデー … 続きを読む
AudioFool: Fast, Universal and synchronization-free Cross-Domain Attack on Speech Recognition
要約 自動音声認識システムは、デバイス上で実行されるコマンドを操作する敵対的な攻 … 続きを読む
Automatic Bat Call Classification using Transformer Networks
要約 コウモリのエコーロケーション鳴き声からコウモリの種を自動的に識別することは … 続きを読む
A Large-scale Dataset for Audio-Language Representation Learning
要約 AI コミュニティは、大規模なマルチモーダル データセットを活用した強力な … 続きを読む
MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation
要約 事前トレーニングされた言語モデルは、さまざまな音楽の理解と生成のタスクにお … 続きを読む
Motif-Centric Representation Learning for Symbolic Music
要約 音楽モチーフは、作曲の概念的な構成要素として、音楽構造の分析と自動作曲にと … 続きを読む
Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation
要約 拡散モデルは、大部分の Text-to-Audio (TTA) 生成方法を … 続きを読む
Improving Speaker Diarization using Semantic Information: Joint Pairwise Constraints Propagation
要約 話者ダイアライゼーションは、音声処理研究コミュニティ内でかなりの注目を集め … 続きを読む