-
最近の投稿
- Lightning UQ Box: A Comprehensive Framework for Uncertainty Quantification in Deep Learning
- Fine-Grained Expressive Power of Weisfeiler-Leman: A Homomorphism Counting Perspective
- Hybrid Feedback for Three-dimensional Convex Obstacle Avoidance (Extended version)
- Self-Deployable, Adaptive Soft Robots Based on Contracting-Cord Particle Jamming
- DecTrain: Deciding When to Train a DNN Online
-
最近のコメント
表示できるコメントはありません。 cs.AI (27713) cs.CL (20937) cs.CR (2171) cs.CV (34430) cs.LG (32450) cs.RO (15866) cs.SY (2464) eess.IV (4226) eess.SY (2458) stat.ML (4346)
「eess.AS」カテゴリーアーカイブ
This Paper Had the Smartest Reviewers — Flattery Detection Utilising an Audio-Textual Transformer-Based Approach
要約 お世辞は人間のコミュニケーションの重要な側面であり、戦略的な褒め言葉や賞賛 … 続きを読む
Discrete Multimodal Transformers with a Pretrained Large Language Model for Mixed-Supervision Speech Processing
要約 離散音声トークン化に関する最近の研究により、音声認識、テキストから音声への … 続きを読む
Soundify: Matching Sound Effects to Video
要約 ビデオ編集の分野では、サウンドはオブジェクトに個性を加え、視聴者を空間に没 … 続きを読む
Towards Zero-Shot Text-To-Speech for Arabic Dialects
要約 ゼロショット マルチスピーカー テキスト読み上げ (ZS-TTS) システ … 続きを読む
Children’s Speech Recognition through Discrete Token Enhancement
要約 子供の音声認識は、主に公的に利用可能なデータが不足しているため、リソースが … 続きを読む
Towards Zero-Shot Text-To-Speech for Arabic Dialects
要約 ゼロショット マルチスピーカー テキスト読み上げ (ZS-TTS) システ … 続きを読む
Speech foundation models in healthcare: Effect of layer selection on pathological speech feature prediction
要約 音声から臨床情報を正確に抽出することは、多くの神経学的症状の診断と治療にと … 続きを読む
The Greek podcast corpus: Competitive speech models for low-resourced languages with weakly supervised data
要約 デジタル表現が限られた言語の音声技術の開発は、主に利用可能なデータの不足に … 続きを読む
Speech Emotion Recognition under Resource Constraints with Data Distillation
要約 音声感情認識 (SER) は、人間とコンピューターの対話において重要な役割 … 続きを読む
DASB — Discrete Audio and Speech Benchmark
要約 離散オーディオ トークンは、オーディオと言語処理を接続し、最新のマルチモー … 続きを読む