-
最近の投稿
- Design, Integration, and Evaluation of a Dual-Arm Robotic System for High Throughput Tissue Sampling from Potato Tubers
- Uncertainty-aware Latent Safety Filters for Avoiding Out-of-Distribution Failures
- Reconfigurable legged metamachines that run on autonomous modular legs
- Improved Approximation of Sensor Network Performance for Seabed Acoustic Sensors
- HMCF: A Human-in-the-loop Multi-Robot Collaboration Framework Based on Large Language Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (37540) cs.CL (28390) cs.CV (43189) cs.HC (2869) cs.LG (42477) cs.RO (22278) cs.SY (3418) eess.IV (5019) eess.SY (3410) stat.ML (5541)
「eess.AS」カテゴリーアーカイブ
A Multi-task Learning Balanced Attention Convolutional Neural Network Model for Few-shot Underwater Acoustic Target Recognition
要約 水中音響ターゲット認識(UATR)は、海洋の多様性と国防の安全を保護するた … 続きを読む
SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning
要約 Sift(音声指導の微調整)、音声テキスト大規模言語モデル(LLM)の指示 … 続きを読む
Dysarthria Normalization via Local Lie Group Transformations for Robust ASR
要約 スペクトログラムのローカルリーグループ変換を使用して、ダイサルトリック音声 … 続きを読む
Taming Data and Transformers for Audio Generation
要約 アンビエントサウンドジェネレーターのスケーラビリティは、データ不足、キャプ … 続きを読む
Respiratory Inhaler Sound Event Classification Using Self-Supervised Learning
要約 喘息は、世界中の何百万人もの人々に影響を与える慢性呼吸条件です。 この状態 … 続きを読む
SpoofCeleb: Speech Deepfake Detection and SASV In The Wild
要約 このペーパーでは、音声ディープファーク検出(SDD)およびスプーフィングの … 続きを読む
Pseudo-Autoregressive Neural Codec Language Models for Efficient Zero-Shot Text-to-Speech Synthesis
要約 最近のゼロショットテキスト(TTS)システムは一般的なジレンマに直面してい … 続きを読む
Generalized Multilingual Text-to-Speech Generation with Language-Aware Style Adaptation
要約 テキストツースピーチ(TTS)モデルは、音素を波形に変換することにより、複 … 続きを読む
On The Landscape of Spoken Language Models: A Comprehensive Survey
要約 音声言語処理の分野は、普遍的な音声処理システムとして機能するカスタム構築の … 続きを読む
Towards Unified Music Emotion Recognition across Dimensional and Categorical Models
要約 音楽感情認識(MER)における最も重要な課題の1つは、感情ラベルがカテゴリ … 続きを読む