-
最近の投稿
- Lightning UQ Box: A Comprehensive Framework for Uncertainty Quantification in Deep Learning
- Fine-Grained Expressive Power of Weisfeiler-Leman: A Homomorphism Counting Perspective
- Hybrid Feedback for Three-dimensional Convex Obstacle Avoidance (Extended version)
- Self-Deployable, Adaptive Soft Robots Based on Contracting-Cord Particle Jamming
- DecTrain: Deciding When to Train a DNN Online
-
最近のコメント
表示できるコメントはありません。 cs.AI (27713) cs.CL (20937) cs.CR (2171) cs.CV (34430) cs.LG (32450) cs.RO (15866) cs.SY (2464) eess.IV (4226) eess.SY (2458) stat.ML (4346)
「cs.SD」カテゴリーアーカイブ
Naturalistic Music Decoding from EEG Data via Latent Diffusion Models
要約 この論文では、脳波記録から自然主義的な音楽を再構成するタスクに、強力な生成 … 続きを読む
Naturalistic Music Decoding from EEG Data via Latent Diffusion Models
要約 この記事では、脳波 (EEG) 記録から自然な音楽を再構築するタスクに、強 … 続きを読む
Robust Zero-Shot Text-to-Speech Synthesis with Reverse Inference Optimization
要約 この論文では、人間のフィードバックからの強化学習 (RLHF) を使用して … 続きを読む
Towards Robust Speech Representation Learning for Thousands of Languages
要約 自己教師あり学習 (SSL) は、ラベル付きデータの必要性を減らし、音声テ … 続きを読む
SlideAVSR: A Dataset of Paper Explanation Videos for Audio-Visual Speech Recognition
要約 オーディオビジュアル音声認識 (AVSR) は、自動音声認識 (ASR) … 続きを読む
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)
要約 Explainable AI for the Arts (XAIxArts … 続きを読む
Deep Active Audio Feature Learning in Resource-Constrained Environments
要約 ラベル付きデータが不足しているため、生体音響アプリケーションでのディープ … 続きを読む
Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models
要約 現在の音声ディープフェイク検出器にとって一般化は主な問題であり、配布外のデ … 続きを読む
ManiWAV: Learning Robot Manipulation from In-the-Wild Audio-Visual Data
要約 音声信号は、ロボットの相互作用や接触による物体の特性に関する豊富な情報を提 … 続きを読む
Advancing Airport Tower Command Recognition: Integrating Squeeze-and-Excitation and Broadcasted Residual Learning
要約 パイロットは航空交通管制の指示に正確に従わなければならないため、航空コマン … 続きを読む