-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
「eess.AS」カテゴリーアーカイブ
Cross Pseudo-Labeling for Semi-Supervised Audio-Visual Source Localization
要約 AVSL (Audio-Visual Source Localizatio … 続きを読む
Dual Mean-Teacher: An Unbiased Semi-Supervised Framework for Audio-Visual Source Localization
要約 AVSL (Audio-Visual Source Localizatio … 続きを読む
a-DCF: an architecture agnostic metric with application to spoofing-robust speaker verification
要約 なりすまし検出は今日主流の研究テーマである。標準的なメトリクスは、単独のス … 続きを読む
Automatic Speech Recognition using Advanced Deep Learning Approaches: A survey
要約 近年のディープラーニング(DL)の進歩は、自動音声認識(ASR)に大きな課 … 続きを読む
A Closer Look at Wav2Vec2 Embeddings for On-Device Single-Channel Speech Enhancement
要約 自己教師付き学習モデルは、自動音声認識、話者識別、キーワード検出など、特定 … 続きを読む
Unraveling Adversarial Examples against Speaker Identification — Techniques for Attack Detection and Victim Model Classification
要約 敵対的な例が話者識別システムを脅かすことが証明されており、それらに対するい … 続きを読む
Compact Speech Translation Models via Discrete Speech Units Pretraining
要約 音声翻訳 (ST) で優れた結果を得るには、モデルの初期化として自己教師あ … 続きを読む
The NPU-ASLP-LiAuto System Description for Visual Speech Recognition in CNVSRC 2023
要約 この論文は、2023 年の第 1 回中国語連続視覚音声認識チャレンジ (C … 続きを読む
Probing the Information Encoded in Neural-based Acoustic Models of Automatic Speech Recognition Systems
要約 深層学習アーキテクチャは、多くの研究分野でパフォーマンスの面で大幅な進歩を … 続きを読む
Investigation of Adapter for Automatic Speech Recognition in Noisy Environment
要約 自動音声認識 (ASR) システムを目に見えない騒音環境に適応させることが … 続きを読む