-
最近の投稿
- Counter-Hypothetical Particle Filters for Single Object Pose Tracking
- Robust High-Speed State Estimation for Off-road Navigation using Radar Velocity Factors
- A Propagation Perspective on Recursive Forward Dynamics for Systems with Kinematic Loops
- D2S: Representing sparse descriptors and 3D coordinates for camera relocalization
- Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments
-
最近のコメント
表示できるコメントはありません。 cs.AI (28533) cs.CL (21568) cs.CR (2228) cs.CV (35151) cs.LG (33295) cs.RO (16470) cs.SY (2535) eess.IV (4282) eess.SY (2529) stat.ML (4465)
「eess.AS」カテゴリーアーカイブ
Exploring Turkish Speech Recognition via Hybrid CTC/Attention Architecture and Multi-feature Fusion Network
要約 近年、ディープラーニングに基づくEnd-to-Endの音声認識技術が急速に … 続きを読む
Posthoc Interpretation via Quantization
要約 この論文では、訓練された分類器によって行われた決定を解釈するための、「量子 … 続きを読む
End-to-End Integration of Speech Separation and Voice Activity Detection for Low-Latency Diarization of Telephone Conversations
要約 最近の研究は、主に音声分離の最近の進歩のおかげで、音声分離誘導ダイアライゼ … 続きを読む
Transformers in Speech Processing: A Survey
要約 自然言語処理の分野におけるトランスフォーマーの目覚ましい成功は、音声処理コ … 続きを読む
Highly Efficient Real-Time Streaming and Fully On-Device Speaker Diarization with Multi-Stage Clustering
要約 話者ダイアライゼーションにおける最近の研究の進歩は、主にダイアライゼーショ … 続きを読む
A Deep Learning System for Domain-specific speech Recognition
要約 人間と機械の音声インターフェイスにより、ますますインテリジェントになる機械 … 続きを読む
Relate auditory speech to EEG by shallow-deep attention-based network
要約 脳波 (EEG) は、脳がさまざまな刺激にどのように反応するかを検出する上 … 続きを読む
Exploring Representation Learning for Small-Footprint Keyword Spotting
要約 この論文では、低リソース キーワード スポッティング (KWS) の表現学 … 続きを読む
On-the-fly Text Retrieval for End-to-End ASR Adaptation
要約 エンド ツー エンドの音声認識モデルは、通常は外部言語モデルとの融合によっ … 続きを読む
Code-Switching Text Generation and Injection in Mandarin-English ASR
要約 コードスイッチング音声とは、1 つの発話内で 2 つ以上の言語を混合するこ … 続きを読む