-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
Efficient Speech Translation with Dynamic Latent Perceivers
要約 近年、トランスフォーマーは音声翻訳の主要なアーキテクチャであり、翻訳品質の … 続きを読む
Improving Accented Speech Recognition with Multi-Domain Training
要約 自己教師あり学習の台頭により、自動音声認識 (ASR) システムは現在、さ … 続きを読む
DECAR: Deep Clustering for learning general-purpose Audio Representations
要約 汎用の音声表現を学習するための自己教師あり事前トレーニング アプローチであ … 続きを読む
Improving Prosody for Cross-Speaker Style Transfer by Semi-Supervised Style Extractor and Hierarchical Modeling in Speech Synthesis
要約 音声合成における話者間スタイル転送は、スタイルをソース スピーカーからター … 続きを読む
A Study on Bias and Fairness In Deep Speaker Recognition
要約 個人を認証し、サービスをパーソナライズする手段として話者認識 (SR) シ … 続きを読む
Multi-Microphone Speaker Separation by Spatial Regions
要約 残響のあるマルチマイク録音の領域ベースのソース分離のタスクを検討します。 … 続きを読む
Learning Audio Features with Metadata and Contrastive Learning
要約 アノテーションをエンドツーエンドで使用する教師あり学習に基づく方法は、分類 … 続きを読む
Perceptual-Neural-Physical Sound Matching
要約 サウンド マッチング アルゴリズムは、パラメトリック オーディオ合成によっ … 続きを読む
Improving the Intent Classification accuracy in Noisy Environment
要約 意図分類は、主にエンド ツー エンドのニューラル モデルでアプローチできる … 続きを読む