-
最近の投稿
- A Hierarchical Reinforcement Learning Framework for Multi-UAV Combat Using Leader-Follower Strategy
- A 65 nm Bayesian Neural Network Accelerator with 360 fJ/Sample In-Word GRNG for AI Uncertainty Estimation
- Map Prediction and Generative Entropy for Multi-Agent Exploration
- Polyhedral Collision Detection via Vertex Enumeration
- Safe and Efficient Robot Action Planning in the Presence of Unconcerned Humans
-
最近のコメント
表示できるコメントはありません。 cs.AI (32657) cs.CL (24688) cs.CR (2523) cs.CV (38845) cs.LG (37527) cs.RO (19009) cs.SY (2906) eess.IV (4656) eess.SY (2900) stat.ML (4944)
「cs.SD」カテゴリーアーカイブ
Inter-linguistic Phonetic Composition (IPC): A Theoretical and Computational Approach to Enhance Second Language Pronunciation
要約 第 2 言語 (L2) の学習者は、L2 の母語話者がこれらの音を別個で交 … 続きを読む
A Suite for Acoustic Language Model Evaluation
要約 音声言語モデルは最近、汎用音声処理システムとして大きな可能性を示しています … 続きを読む
Continuous Autoregressive Models with Noise Augmentation Avoid Error Accumulation
要約 自己回帰モデルは通常、離散トークンのシーケンスに適用されますが、最近の研究 … 続きを読む
Learning Spatially-Aware Language and Audio Embeddings
要約 人間は、不正確な自然言語記述が与えられたとしても、音のシーンを思い描くこと … 続きを読む
WavChat: A Survey of Spoken Dialogue Models
要約 GPT-4o などのシステムに代表される音声対話モデルの最近の進歩は、音声 … 続きを読む
The ParlaSpeech Collection of Automatically Generated Speech and Text Datasets from Parliamentary Proceedings
要約 音声および言語テクノロジにおける最近の大幅な改善は、生の言語データに対する … 続きを読む
Scaling Speech-Text Pre-training with Synthetic Interleaved Data
要約 音声言語モデル (SpeechLM) は、音声入力を受け入れて音声出力を生 … 続きを読む
Automatic Album Sequencing
要約 アルバムの順序付けは、アルバム制作プロセスの重要な部分です。 最近、コレク … 続きを読む
DeltaKWS: A 65nm 36nJ/Decision Bio-inspired Temporal-Sparsity-Aware Digital Keyword Spotting IC with 0.6V Near-Threshold SRAM
要約 この文書では、私たちの知る限り、音声制御デバイス向けの $\Delta$R … 続きを読む