-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Efficient Speech Translation with Dynamic Latent Perceivers
要約 近年、トランスフォーマーは音声翻訳の主要なアーキテクチャであり、翻訳品質の … 続きを読む
TriNet: stabilizing self-supervised learning from complete or slow collapse on ASR
要約 自己教師あり学習 (SSL) モデルは、急激な情報崩壊やゆっくりとした次元 … 続きを読む
Improving Accented Speech Recognition with Multi-Domain Training
要約 自己教師あり学習の台頭により、自動音声認識 (ASR) システムは現在、さ … 続きを読む
DECAR: Deep Clustering for learning general-purpose Audio Representations
要約 汎用の音声表現を学習するための自己教師あり事前トレーニング アプローチであ … 続きを読む
Improving Prosody for Cross-Speaker Style Transfer by Semi-Supervised Style Extractor and Hierarchical Modeling in Speech Synthesis
要約 音声合成における話者間スタイル転送は、スタイルをソース スピーカーからター … 続きを読む
A Study on Bias and Fairness In Deep Speaker Recognition
要約 個人を認証し、サービスをパーソナライズする手段として話者認識 (SR) シ … 続きを読む
Multi-Microphone Speaker Separation by Spatial Regions
要約 残響のあるマルチマイク録音の領域ベースのソース分離のタスクを検討します。 … 続きを読む
Learning Audio Features with Metadata and Contrastive Learning
要約 アノテーションをエンドツーエンドで使用する教師あり学習に基づく方法は、分類 … 続きを読む
Perceptual-Neural-Physical Sound Matching
要約 サウンド マッチング アルゴリズムは、パラメトリック オーディオ合成によっ … 続きを読む
Learning ASR pathways: A sparse multilingual ASR model
要約 ニューラル ネットワーク プルーニングは、自動音声認識 (ASR) モデル … 続きを読む