-
最近の投稿
- Cybernetic Marionette: Channeling Collective Agency Through a Wearable Robot in a Live Dancer-Robot Duet
- Leveraging LLMs for Mission Planning in Precision Agriculture
- Estimating the Joint Probability of Scenario Parameters with Gaussian Mixture Copula Models
- One For All: LLM-based Heterogeneous Mission Planning in Precision Agriculture
- Provable Sim-to-Real Transfer via Offline Domain Randomization
-
最近のコメント
表示できるコメントはありません。 cs.AI (39605) cs.CL (29980) cs.CV (44945) cs.HC (3015) cs.LG (44541) cs.RO (23689) cs.SY (3609) eess.IV (5149) eess.SY (3601) stat.ML (5787)
「eess.AS」カテゴリーアーカイブ
Audio-CoT: Exploring Chain-of-Thought Reasoning in Large Audio Language Model
要約 Large Audio-Language Model (LALM) は、音 … 続きを読む
Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding
要約 音声言語理解 (SLU) は、音声の分野における構造予測タスクです。 最近 … 続きを読む
Estimating Musical Surprisal in Audio
要約 計算手法を使用して音楽の驚きの期待をモデル化する際に、自己回帰モデルからの … 続きを読む
The Sound of Water: Inferring Physical Properties from Pouring Liquids
要約 私たちは、視聴覚観察と、液体を注ぐという平凡だが興味深い日常活動の基礎とな … 続きを読む
Comparing Self-Supervised Learning Models Pre-Trained on Human Speech and Animal Vocalizations for Bioacoustics Processing
要約 自己教師あり学習 (SSL) 基盤モデルは、幅広いタスクに適用できる強力で … 続きを読む
MARS6: A Small and Robust Hierarchical-Codec Text-to-Speech Model
要約 コーデックベースの Text-to-Speech (TTS) モデルは、ゼ … 続きを読む
Towards Early Prediction of Self-Supervised Speech Model Performance
要約 自己教師あり学習 (SSL) では、事前トレーニングと評価にリソースが大量 … 続きを読む
Benchmarking Rotary Position Embeddings for Automatic Speech Recognition
要約 Rotary Position Embedding (RoPE) は、シー … 続きを読む
xLSTM-SENet: xLSTM for Single-Channel Speech Enhancement
要約 Conformers などのアテンションベースのアーキテクチャは音声強調に … 続きを読む