-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
「cs.SD」カテゴリーアーカイブ
RoDia: A New Dataset for Romanian Dialect Identification from Speech
要約 方言の識別は、音声処理および言語テクノロジにおいて重要なタスクであり、音声 … 続きを読む
Leveraging Large Language Models for Exploiting ASR Uncertainty
要約 大規模な言語モデルはさまざまな自然言語処理 (NLP) タスクに優れていま … 続きを読む
Diffusion-Based Co-Speech Gesture Generation Using Joint Text and Audio Representation
要約 この論文では、GENEA (身体エージェントのための非言語行動の生成と評価 … 続きを読む
GRASS: Unified Generation Model for Speech-to-Semantic Tasks
要約 この論文では、音声データのタスク関連プロンプトを条件としたターゲット テキ … 続きを読む
Addressing Feature Imbalance in Sound Source Separation
要約 ニューラル ネットワークは、タスクを解決するために特定の機能に過度に依存し … 続きを読む
Multi-Modal Automatic Prosody Annotation with Contrastive Pretraining of SSWP
要約 表現力豊かな Text-to-Speech (TTS) の領域では、明示的 … 続きを読む
LeBenchmark 2.0: a Standardized, Replicable and Enhanced Framework for Self-supervised Representations of French Speech
要約 自己教師あり学習 (SSL) は、コンピューター ビジョンや自然言語処理な … 続きを読む
Parallel and Limited Data Voice Conversion Using Stochastic Variational Deep Kernel Learning
要約 通常、音声変換はトレーニング データが限られているエンジニアリング上の問題 … 続きを読む
LanSER: Language-Model Supported Speech Emotion Recognition
要約 音声感情認識 (SER) モデルは通常、トレーニングにコストのかかる人間が … 続きを読む
Multiple Representation Transfer from Large Language Models to End-to-End ASR Systems
要約 大規模言語モデル (LLM) の知識の転送は、言語知識をエンドツーエンドの … 続きを読む