-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit
要約 TITLE – ESPnet-ST-v2:多目的音声言語翻訳ツ … 続きを読む
An Empirical Study and Improvement for Speech Emotion Recognition
要約 タイトル:発話感情認識のための実証的研究と改善 要約: – マ … 続きを読む
An investigation of speaker independent phrase break models in End-to-End TTS systems
要約 タイトル:End-to-End TTSシステムにおける話者非依存フレーズブ … 続きを読む
Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions
要約 タイトル:音声認識転写におけるリスナーアウェアなバックチャンネル予測 要約 … 続きを読む
ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit
要約 タイトル:ESPnet-ST-v2:多目的口頭言語翻訳ツールキット 要約: … 続きを読む
M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval
要約 タイトル:M-SpeechCLIP:大規模な事前トレーニング済みモデルを利 … 続きを読む
Enhancing Speech-to-Speech Translation with Multiple TTS Targets
要約 タイトル:複数のTTSターゲットを用いた音声-音声翻訳の向上 要約: &# … 続きを読む
FAIR4Cov: Fused Audio Instance and Representation for COVID-19 Detection
要約 タイトル: FAIR4Cov: COVID-19検出のための融合されたオー … 続きを読む
Anomalous Sound Detection using Audio Representation with Machine ID based Contrastive Learning Pretraining
要約 タイトル:機械IDベースの対比学習による音声表現を用いた異常音の検出 要約 … 続きを読む