-
最近の投稿
- Design, Integration, and Evaluation of a Dual-Arm Robotic System for High Throughput Tissue Sampling from Potato Tubers
- Uncertainty-aware Latent Safety Filters for Avoiding Out-of-Distribution Failures
- Reconfigurable legged metamachines that run on autonomous modular legs
- Improved Approximation of Sensor Network Performance for Seabed Acoustic Sensors
- HMCF: A Human-in-the-loop Multi-Robot Collaboration Framework Based on Large Language Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (37540) cs.CL (28390) cs.CV (43189) cs.HC (2869) cs.LG (42477) cs.RO (22278) cs.SY (3418) eess.IV (5019) eess.SY (3410) stat.ML (5541)
「eess.AS」カテゴリーアーカイブ
Exploring Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations
要約 音楽と音楽からの感情の認識は、音響の重複のために類似点を共有しており、これ … 続きを読む
End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation
要約 オーディオディープフェイクは、デジタルセキュリティと信頼に対する脅威の高ま … 続きを読む
Versatile Framework for Song Generation with Prompt-based Control
要約 Song Generationは、さまざまなプロンプトに基づいて制御可能な … 続きを読む
Non-native Children’s Automatic Speech Assessment Challenge (NOCASA)
要約 このペーパーでは、「非ネイティブチルドレンの自動音声評価」(NOCASA) … 続きを読む
Mitigating Timbre Leakage with Universal Semantic Mapping Residual Block for Voice Conversion
要約 音声変換(VC)は、コンテンツを保存することにより、ソース音声をターゲット … 続きを読む
End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation
要約 オーディオディープフェイクは、デジタルセキュリティと信頼に対する脅威の高ま … 続きを読む
Tracking Articulatory Dynamics in Speech with a Fixed-Weight BiLSTM-CNN Architecture
要約 音声生成は、さまざまな調音の特徴の調整を含む複雑な連続プロセスです。 その … 続きを読む
Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition
要約 このペーパーでは、監視なしで監視されたAL方法を組み合わせた、自動音声認識 … 続きを読む
Spatial Audio Processing with Large Language Model on Wearable Devices
要約 空間的コンテキストを大規模な言語モデル(LLM)に統合することは、特にウェ … 続きを読む