-
最近の投稿
- Interação entre robôs humanoides: desenvolvendo a colaboração e comunicação autônoma
- Estimating the Spectral Moments of the Kernel Integral Operator from Finite Sample Matrices
- PnLCalib: Sports Field Registration via Points and Lines Optimization
- Understanding When Tree of Thoughts Succeeds: Larger Models Excel in Generation, Not Discrimination
- Cross-Category Functional Grasp Transfer
-
最近のコメント
表示できるコメントはありません。 cs.AI (28535) cs.CL (21571) cs.CR (2228) cs.CV (35152) cs.LG (33296) cs.RO (16472) cs.SY (2535) eess.IV (4282) eess.SY (2529) stat.ML (4466)
「eess.AS」カテゴリーアーカイブ
Cocktail HuBERT: Generalized Self-Supervised Pre-training for Mixture and Single-Source Speech
要約 自己教師あり学習は、ラベル付けされていないデータを効果的に活用し、ラベル付 … 続きを読む
Multitrack Music Transformer
要約 変圧器モデルを使用してマルチトラック音楽を生成するための既存のアプローチは … 続きを読む
Dual-stream Time-Delay Neural Network with Dynamic Global Filter for Speaker Verification
要約 時間遅延ニューラル ネットワーク (TDNN) は、テキストに依存しない話 … 続きを読む
Sound Localization from Motion: Jointly Learning Sound Direction and Camera Rotation
要約 私たちが知覚する画像と音は、頭を回転させると、微妙ではあるが幾何学的に一貫 … 続きを読む
Development of a Voice Controlled Robotic Arm
要約 この論文では、人間の声で制御され、CUET メカトロニクス研究所で開発され … 続きを読む
I Know Your Feelings Before You Do: Predicting Future Affective Reactions in Human-Computer Dialogue
要約 現在の音声対話システム (SDS) は、多くの場合、ユーザーの音声を受信し … 続きを読む
Comparative layer-wise analysis of self-supervised speech models
要約 事前トレーニングの目的、入力モダリティ、および事前トレーニング データが異 … 続きを読む
BECTRA: Transducer-based End-to-End ASR with BERT-Enhanced Encoder
要約 BERT-CTC-Transducer (BECTRA) は、BERT で … 続きを読む
InterMPL: Momentum Pseudo-Labeling with Intermediate CTC Loss
要約 この論文では、InterMPL を紹介します。これは、中間教師による疑似ラ … 続きを読む
E2E Spoken Entity Extraction for Virtual Agents
要約 このホワイト ペーパーでは、音声エンコーダを使用した音声処理のいくつかの側 … 続きを読む