-
最近の投稿
- Counter-Hypothetical Particle Filters for Single Object Pose Tracking
- Robust High-Speed State Estimation for Off-road Navigation using Radar Velocity Factors
- A Propagation Perspective on Recursive Forward Dynamics for Systems with Kinematic Loops
- D2S: Representing sparse descriptors and 3D coordinates for camera relocalization
- Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments
-
最近のコメント
表示できるコメントはありません。 cs.AI (28533) cs.CL (21568) cs.CR (2228) cs.CV (35151) cs.LG (33295) cs.RO (16470) cs.SY (2535) eess.IV (4282) eess.SY (2529) stat.ML (4465)
「eess.AS」カテゴリーアーカイブ
Sim-T: Simplify the Transformer Network by Multiplexing Technique for Speech Recognition
要約 タイトル:音声認識向けTransformerネットワークをMultiple … 続きを読む
AffectMachine-Classical: A novel system for generating affective classical music
要約 タイトル:感情的なクラシック音楽を生成するための新しいシステム、Affec … 続きを読む
ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit
要約 TITLE – ESPnet-ST-v2:多目的音声言語翻訳ツ … 続きを読む
An Empirical Study and Improvement for Speech Emotion Recognition
要約 タイトル:発話感情認識のための実証的研究と改善 要約: – マ … 続きを読む
An investigation of speaker independent phrase break models in End-to-End TTS systems
要約 タイトル:End-to-End TTSシステムにおける話者非依存フレーズブ … 続きを読む
Oh, Jeez! or Uh-huh? A Listener-aware Backchannel Predictor on ASR Transcriptions
要約 タイトル:音声認識転写におけるリスナーアウェアなバックチャンネル予測 要約 … 続きを読む
ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit
要約 タイトル:ESPnet-ST-v2:多目的口頭言語翻訳ツールキット 要約: … 続きを読む
M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval
要約 タイトル:M-SpeechCLIP:大規模な事前トレーニング済みモデルを利 … 続きを読む
Enhancing Speech-to-Speech Translation with Multiple TTS Targets
要約 タイトル:複数のTTSターゲットを用いた音声-音声翻訳の向上 要約: &# … 続きを読む