-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Automatic Proficiency Assessment in L2 English Learners
要約 英語の第二言語能力(L2)は通常、英語の教師または専門家の評価者によって知 … 続きを読む
fastabx: A library for efficient computation of ABX discriminability
要約 ABX差別タスクを構築するための高性能PythonライブラリであるFast … 続きを読む
LLaMA-Omni2: LLM-based Real-time Spoken Chatbot with Autoregressive Streaming Speech Synthesis
要約 リアルタイムでインテリジェントかつ自然な音声対話は、次世代の人間とコンピュ … 続きを読む
FolAI: Synchronized Foley Sound Generation with Semantic and Temporal Alignment
要約 従来のサウンドデザインワークフローは、フォーリーサウンドデザインのように、 … 続きを読む
How much to Dereverberate? Low-Latency Single-Channel Speech Enhancement in Distant Microphone Scenarios
要約 残響除去は、信号の明瞭度と品質を向上させる音声強調(SE)の重要なサブタス … 続きを読む
REFFLY: Melody-Constrained Lyrics Editing Model
要約 メロディから歌詞への自動生成(M2L)は、与えられたメロディに沿った歌詞を … 続きを読む
CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment
要約 オーディオビジュアル学習における最近の進歩は、モダリティを超えた表現の学習 … 続きを読む
FlowDubber: Movie Dubbing with LLM-based Semantic-aware Learning and Flow Matching based Voice Enhancing
要約 ムービーダビングは、与えられた短い参照音声のボーカルの音色を維持しながら、 … 続きを読む
Voice Cloning: Comprehensive Survey
要約 音声クローニングは、今日のデジタルの世界で急速に進歩しており、多くの研究者 … 続きを読む