-
最近の投稿
- Computing High-dimensional Confidence Sets for Arbitrary Distributions
- Reservoir Computing: A New Paradigm for Neural Networks
- A Dynamic, Ordinal Gaussian Process Item Response Theoretic Model
- Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking
- MiLo: Efficient Quantized MoE Inference with Mixture of Low-Rank Compensators
-
最近のコメント
表示できるコメントはありません。 cs.AI (36107) cs.CL (27319) cs.CR (2749) cs.CV (41949) cs.LG (41080) cs.RO (21304) cs.SY (3219) eess.IV (4921) eess.SY (3213) stat.ML (5380)
「cs.SD」カテゴリーアーカイブ
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation
要約 音声品質評価では通常、平均オピニオンスコア(MOS)や話者類似度(SIM) … 続きを読む
Offload Rethinking by Cloud Assistance for Efficient Environmental Sound Recognition on LPWANs
要約 学習ベースの環境音認識は、生物学研究や都市規模のセンシングシステムにおける … 続きを読む
Open-Source Manually Annotated Vocal Tract Database for Automatic Segmentation from 3D MRI Using Deep Learning: Benchmarking 2D and 3D Convolutional and Transformer Networks
要約 さまざまな音声および音声アプリケーションには、磁気共鳴イメージング(MRI … 続きを読む
On Adversarial Attacks In Acoustic Drone Localization
要約 マルチローターの空中自動運転車(MAV、より広く知られている「ドローン」) … 続きを読む
Adapting Automatic Speech Recognition for Accented Air Traffic Control Communications
要約 航空交通管制(ATC)における効果的なコミュニケーションは、航空の安全性を … 続きを読む
Optimizing Multi-Stuttered Speech Classification: Leveraging Whisper’s Encoder for Efficient Parameter Reduction in Automated Assessment
要約 st音の自動分類は、音声言語病理学者に支援を提供するタイムリーな評価に大き … 続きを読む
Combining TF-GridNet and Mixture Encoder for Continuous Speech Separation for Meeting Transcription
要約 自動音声認識(ASR)の多くの実際のアプリケーションでは、重複した音声の処 … 続きを読む
NeuroVoz: a Castillian Spanish corpus of parkinsonian speech
要約 音声によるパーキンソン病(PD)のスクリーニングは、異なる言語で公開されて … 続きを読む
Exploring Gender Disparities in Automatic Speech Recognition Technology
要約 この研究では、人口統計の従来の調査を超えて、性別全体の自動音声認識(ASR … 続きを読む
Both Ears Wide Open: Towards Language-Driven Spatial Audio Generation
要約 最近、拡散モデルはモノチャネルオーディオ生成で大きな成功を収めています。 … 続きを読む