-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
SeACo-Paraformer: A Non-Autoregressive ASR System with Flexible and Effective Hotword Customization Ability
要約 ホットワードのカスタマイズは、ASR 分野に残された重要な問題の 1 つで … 続きを読む
ChinaTelecom System Description to VoxCeleb Speaker Recognition Challenge 2023
要約 この技術レポートでは、VoxCeleb2023 Speaker Recog … 続きを読む
Approximate Nearest Neighbour Phrase Mining for Contextual Speech Recognition
要約 このペーパーでは、コンテキスト エンコーダーの潜在空間からハード ネガティ … 続きを読む
Text-only domain adaptation for end-to-end ASR using integrated text-to-mel-spectrogram generator
要約 私たちは、文字起こしされた音声データ、テキストのみのデータ、またはその両方 … 続きを読む
Mitigating the Exposure Bias in Sentence-Level Grapheme-to-Phoneme (G2P) Transduction
要約 Text-to-Text Transfer Transformer (T5 … 続きを読む
Allophant: Cross-lingual Phoneme Recognition with Articulatory Attributes
要約 この論文では、多言語音素認識装置 Allophant を提案します。 ター … 続きを読む
Text Injection for Capitalization and Turn-Taking Prediction in Speech Models
要約 自動音声認識 (ASR) のためのテキスト インジェクションは、ペアになっ … 続きを読む
O-1: Self-training with Oracle and 1-best Hypothesis
要約 トレーニングのバイアスを軽減し、音声認識のトレーニングと評価の指標を統合す … 続きを読む
Adaptive Contextual Biasing for Transducer Based Streaming Speech Recognition
要約 追加のコンテキスト情報を組み込むことにより、ディープ バイアス手法が、パー … 続きを読む