-
最近の投稿
- Open-Structure: Structural Benchmark Dataset for SLAM Algorithms
- Goal Inference from Open-Ended Dialog
- Learning a Stable, Safe, Distributed Feedback Controller for a Heterogeneous Platoon of Autonomous Vehicles
- MarineFormer: A Transformer-based Navigation Policy Model for Collision Avoidance in Marine Environment
- RecoveryChaining: Learning Local Recovery Policies for Robust Manipulation
-
最近のコメント
表示できるコメントはありません。 cs.AI (28338) cs.CL (21411) cs.CR (2212) cs.CV (34970) cs.LG (33082) cs.RO (16320) cs.SY (2507) eess.IV (4260) eess.SY (2501) stat.ML (4433)
「eess.AS」カテゴリーアーカイブ
Multilingual Contextual Adapters To Improve Custom Word Recognition In Low-resource Languages
要約 コネクショニスト時間分類 (CTC) モデルは、自動音声認識 (ASR) … 続きを読む
ContextSpeech: Expressive and Efficient Text-to-Speech for Paragraph Reading
要約 最先端の Text-to-Speech システムは、文レベルで非常に高品質 … 続きを読む
AVSegFormer: Audio-Visual Segmentation with Transformer
要約 オーディオとビジョンの組み合わせは、マルチモーダル コミュニティで長い間注 … 続きを読む
Language-agnostic Code-Switching in Sequence-To-Sequence Speech Recognition
要約 コードスイッチング(CS)とは、異なる言語の単語やフレーズを交互に使用する … 続きを読む
Beyond Neural-on-Neural Approaches to Speaker Gender Protection
要約 最近の研究では、性別推論攻撃を防御するために音声を変更するアプローチが提案 … 続きを読む
Towards Improving the Performance of Pre-Trained Speech Models for Low-Resource Languages Through Lateral Inhibition
要約 自然言語処理における Transformer モデルからの双方向エンコーダ … 続きを読む
Empirical Interpretation of the Relationship Between Speech Acoustic Context and Emotion Recognition
要約 音声感情認識 (SER) は、心の知能指数を取得し、音声の文脈上の意味を理 … 続きを読む
Automatic Speech Recognition of Non-Native Child Speech for Language Learning Applications
要約 ボイスボットは、特に第二言語学習の文脈において、言語スキルの発達をサポート … 続きを読む
MooseNet: A Trainable Metric for Synthesized Speech with a PLDA Module
要約 私たちは、聞き手の平均意見スコア (MOS) を予測する訓練可能な音声指標 … 続きを読む
Leveraging Cross-Utterance Context For ASR Decoding
要約 外部言語モデル (LM) は自動音声認識システムのデコード段階に組み込まれ … 続きを読む