-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「eess.AS」カテゴリーアーカイブ
Diffusion Synthesizer for Efficient Multilingual Speech to Speech Translation
要約 DiffuseST は、複数のソース言語から英語に翻訳しながら、入力話者の … 続きを読む
An efficient text augmentation approach for contextualized Mandarin speech recognition
要約 文脈に応じた自動音声認識 (ASR) システムは、一般的ではない単語の認識 … 続きを読む
Simul-Whisper: Attention-Guided Streaming Whisper with Truncation Detection
要約 Whisper は、堅牢かつ大規模な多言語音声認識モデルとして、多くの低リ … 続きを読む
Detecting the terminality of speech-turn boundary for spoken interactions in French TV and Radio content
要約 トランジション関連性 場所は、対話者が現在の話者の話を遮ることなく発言でき … 続きを読む
On the Evaluation of Speech Foundation Models for Spoken Language Understanding
要約 音声言語理解評価 (SLUE) ベンチマーク タスク スイートは、自然音声 … 続きを読む
Inclusive ASR for Disfluent Speech: Cascaded Large-Scale Self-Supervised Learning with Targeted Fine-Tuning and Data Augmentation
要約 自動音声認識 (ASR) システムは、吃音に関連した不規則性 (不随意なブ … 続きを読む
To what extent can ASV systems naturally defend against spoofing attacks?
要約 現在の自動話者検証 (ASV) タスクには、ターゲットと非ターゲットの 2 … 続きを読む
One-pass Multiple Conformer and Foundation Speech Systems Compression and Quantization Using An All-in-one Neural Model
要約 オールインワンのニューラル モデルを使用した、新しいワンパス複数 ASR … 続きを読む
COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning
要約 音声を大規模言語モデル (LLM) に統合し、その結果、命令追従/コンテキ … 続きを読む
Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation
要約 Audio-Visual Speech Recognition (AVSR … 続きを読む