-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Improving the Intent Classification accuracy in Noisy Environment
要約 意図分類は、主にエンド ツー エンドのニューラル モデルでアプローチできる … 続きを読む
Articulation GAN: Unsupervised modeling of articulatory learning
要約 ジェネレーティブ ディープ ニューラル ネットワークは音声合成に広く使用さ … 続きを読む
Neural Diarization with Non-autoregressive Intermediate Attractors
要約 エンコーダ-デコーダベースのアトラクタ (EDA) を使用したエンド ツー … 続きを読む
Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR
要約 エンドツーエンドの自動音声認識により、入力音声が文字に直接マッピングされま … 続きを読む
DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech
要約 個々の発話のコレクションである現在のテキスト読み上げ (TTS) データセ … 続きを読む
Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models
要約 このホワイト ペーパーでは、多言語の事前トレーニング パラダイムで Con … 続きを読む
Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation
要約 ニューラル トランスデューサーは、自動音声認識 (ASR) のエンド ツー … 続きを読む
LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders
要約 オーディオビジュアルスピーチエンハンスメントは、オーディオ自体だけでなく、 … 続きを読む
Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings
要約 医療コンテキストにおける自動音声認識 (ASR) には、時間の節約、コスト … 続きを読む
Distribution Preserving Source Separation With Time Frequency Predictive Models
要約 最先端の方法の知覚的な欠点に対処することを目的とした、分布を維持するソース … 続きを読む