-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
An investigation of speaker independent phrase break models in End-to-End TTS systems
要約 タイトル:End-to-End TTSシステムにおける話者非依存フレーズブ … 続きを読む
Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions
要約 タイトル:音声認識転写におけるリスナーアウェアなバックチャンネル予測 要約 … 続きを読む
ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit
要約 タイトル:ESPnet-ST-v2:多目的口頭言語翻訳ツールキット 要約: … 続きを読む
M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval
要約 タイトル:M-SpeechCLIP:大規模な事前トレーニング済みモデルを利 … 続きを読む
Enhancing Speech-to-Speech Translation with Multiple TTS Targets
要約 タイトル:複数のTTSターゲットを用いた音声-音声翻訳の向上 要約: &# … 続きを読む
FAIR4Cov: Fused Audio Instance and Representation for COVID-19 Detection
要約 タイトル: FAIR4Cov: COVID-19検出のための融合されたオー … 続きを読む
Anomalous Sound Detection using Audio Representation with Machine ID based Contrastive Learning Pretraining
要約 タイトル:機械IDベースの対比学習による音声表現を用いた異常音の検出 要約 … 続きを読む
To Wake-up or Not to Wake-up: Reducing Keyword False Alarm by Successive Refinement
要約 タイトル: 連続した改善によるキーワードの誤設定の軽減 要約: ̵ … 続きを読む
Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings
要約 タイトル:医療現場における自動音声認識性能の向上に向けたクリニカルBERT … 続きを読む