-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
「cs.SD」カテゴリーアーカイブ
t-EER: Parameter-Free Tandem Evaluation of Countermeasures and Biometric Comparators
要約 プレゼンテーション攻撃 (スプーフィング) 検出 (PAD) は通常、生体 … 続きを読む
Weakly-supervised Automated Audio Captioning via text only training
要約 近年、オーディオとキャプションのペアのデータセットにより、オーディオ クリ … 続きを読む
Performance Conditioning for Diffusion-Based Multi-Instrument Music Synthesis
要約 記号的な音楽表現から複数の楽器による音楽を生成することは、音楽情報検索 ( … 続きを読む
Audio Contrastive based Fine-tuning
要約 音声分類は、幅広い用途の音声および音声処理タスクにおいて重要な役割を果たし … 続きを読む
ERNIE-Music: Text-to-Waveform Music Generation with Diffusion Models
要約 近年、拡散モデルへの関心の高まりにより、画像と音声の生成が大幅に進歩しまし … 続きを読む
L1-aware Multilingual Mispronunciation Detection Framework
要約 話者の母語 (L1) と非母語 (L2) の間の音韻の不一致は、発音の誤り … 続きを読む
CoMoSpeech: One-Step Speech and Singing Voice Synthesis via Consistency Model
要約 ノイズ除去拡散確率モデル (DDPM) は、音声合成において有望なパフォー … 続きを読む
TalkNCE: Improving Active Speaker Detection with Talk-Aware Contrastive Learning
要約 この研究の目標は、一連のビデオ フレーム内で人が話しているかどうかを判断す … 続きを読む
Development of Hybrid ASR Systems for Low Resource Medical Domain Conversational Telephone Speech
要約 ますますつながりが増し、グローバル化が進む世界では、言語の壁が大きな課題と … 続きを読む
PromptASR for contextualized ASR with controllable style
要約 プロンプトは、トピックや論理的関係などのコンテキスト情報を提供するため、大 … 続きを読む