-
最近の投稿
- CarbonFish — A Bistable Underactuated Compliant Fish Robot capable of High Frequency Undulation
- MoVEInt: Mixture of Variational Experts for Learning Human-Robot Interactions from Demonstrations
- Make the Pertinent Salient: Task-Relevant Reconstruction for Visual Control with Distractions
- REPeat: A Real2Sim2Real Approach for Pre-acquisition of Soft Food Items in Robot-assisted Feeding
- Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space
-
最近のコメント
表示できるコメントはありません。 cs.AI (28061) cs.CL (21198) cs.CR (2193) cs.CV (34733) cs.LG (32791) cs.RO (16124) cs.SY (2493) eess.IV (4241) eess.SY (2487) stat.ML (4395)
「eess.AS」カテゴリーアーカイブ
tinyCLAP: Distilling Constrastive Language-Audio Pretrained Models
要約 Contrastive Language-Audio Pretrainin … 続きを読む
GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Accurate Speech Emotion Recognition
要約 対照的クロスモダリティ事前トレーニングは、最近さまざまな分野で目覚ましい成 … 続きを読む
The effect of speech pathology on automatic speaker verification — a large-scale study
要約 データ駆動型音声処理の課題を乗り越える際の主なハードルの 1 つは、信頼で … 続きを読む
Audio classification with Dilated Convolution with Learnable Spacings
要約 学習可能な間隔を備えた拡張畳み込み (DCLS) は、バックプロパゲーショ … 続きを読む
Multi-channel Speech Separation Using Spatially Selective Deep Non-linear Filters
要約 複数の話者によるマルチチャンネル分離タスクでは、混合物からすべての個々の音 … 続きを読む
Psychoacoustic Challenges Of Speech Enhancement On VoIP Platforms
要約 VoIP (Voice over Internet Protocol) 通 … 続きを読む
Speaker-Adapted End-to-End Visual Speech Recognition for Continuous Spanish
要約 さまざまな研究により、音声認識プロセス全体を通じて視覚的な手がかりが重要で … 続きを読む
Unified Segment-to-Segment Framework for Simultaneous Sequence Generation
要約 同時シーケンス生成は、ストリーミング音声認識、同時機械翻訳、同時音声翻訳な … 続きを読む
LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT
要約 LyricWhiz は、ロックやメタルなどの難しいジャンルでも、さまざまな … 続きを読む