-
最近の投稿
- Wildfire Autonomous Response and Prediction Using Cellular Automata (WARP-CA)
- Efficient, Responsive, and Robust Hopping on Deformable Terrain
- STRIDE: An Open-Source, Low-Cost, and Versatile Bipedal Robot Platform for Research and Education
- The path towards contact-based physical human-robot interaction
- Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (23612) cs.CL (17743) cs.CR (1849) cs.CV (30671) cs.LG (28379) cs.RO (13239) cs.SY (2101) eess.IV (3780) eess.SY (2096) stat.ML (3899)
「eess.AS」カテゴリーアーカイブ
Is one brick enough to break the wall of spoken dialogue state tracking?
要約 タスク指向対話 (TOD) システムでは、ユーザーの要求に対するシステムの … 続きを読む
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)
要約 Explainable AI for the Arts (XAIxArts … 続きを読む
Deep Active Audio Feature Learning in Resource-Constrained Environments
要約 ラベル付きデータが不足しているため、生体音響アプリケーションでのディープ … 続きを読む
Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models
要約 現在の音声ディープフェイク検出器にとって一般化は主な問題であり、配布外のデ … 続きを読む
ManiWAV: Learning Robot Manipulation from In-the-Wild Audio-Visual Data
要約 音声信号は、ロボットの相互作用や接触による物体の特性に関する豊富な情報を提 … 続きを読む
Advancing Airport Tower Command Recognition: Integrating Squeeze-and-Excitation and Broadcasted Residual Learning
要約 パイロットは航空交通管制の指示に正確に従わなければならないため、航空コマン … 続きを読む
BESTOW: Efficient and Streamable Speech Language Model with the Best of Two Worlds in GPT and T5
要約 音声理解機能を事前トレーニングされた大規模言語モデルに組み込むことは、研究 … 続きを読む
Subtractive Training for Music Stem Insertion using Latent Diffusion Models
要約 私たちは、他の楽器をコンテキストとして与えられた個々の楽器のステムを合成す … 続きを読む
Daisy-TTS: Simulating Wider Spectrum of Emotions via Prosody Embedding Decomposition
要約 私たちは感情を多面的に言葉で表現することがよくありますが、感情の強さはさま … 続きを読む