-
最近の投稿
- A Data-Driven Modeling and Motion Control of Heavy-Load Hydraulic Manipulators via Reversible Transformation
- Data-Driven Multi-step Nonlinear Model Predictive Control for Industrial Heavy Load Hydraulic Robot
- Image Compression Using Novel View Synthesis Priors
- OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments
- t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving
-
最近のコメント
表示できるコメントはありません。 cs.AI (29990) cs.CL (22653) cs.CR (2325) cs.CV (36362) cs.LG (34812) cs.RO (17416) cs.SY (2673) eess.IV (4425) eess.SY (2667) stat.ML (4642)
「eess.AS」カテゴリーアーカイブ
Pareto Data Framework: Steps Towards Resource-Efficient Decision Making Using Minimum Viable Data (MVD)
要約 このペーパーでは、組み込みシステム、モバイル デバイス、モノのインターネッ … 続きを読む
Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models
要約 ビッグデータと大規模言語モデル時代の到来により、ゼロショットでパーソナライ … 続きを読む
HLTCOE JHU Submission to the Voice Privacy Challenge 2024
要約 我々は、kNN-VC 法や WavLM 音声変換法などの音声変換ベースのシ … 続きを読む
LC-Protonets: Multi-label Few-shot learning for world music audio tagging
要約 我々は、モデルを少数の利用可能な例のみに基づいて新しいクラスに一般化する必 … 続きを読む
Learning Spatially-Aware Language and Audio Embedding
要約 人間は、不正確な自然言語記述が与えられたとしても、音のシーンを思い描くこと … 続きを読む
Spontaneous Informal Speech Dataset for Punctuation Restoration
要約 現在、句読点復元モデルは、ほぼ完全に構造化され、スクリプト化されたコーパス … 続きを読む
WER We Stand: Benchmarking Urdu ASR Models
要約 このペーパーでは、ウルドゥー語自動音声認識 (ASR) モデルの包括的な評 … 続きを読む
High-Resolution Speech Restoration with Latent Diffusion Model
要約 従来の音声強調方法は、単一の種類の歪みに焦点を当てて復元タスクを過度に単純 … 続きを読む
Learning Source Disentanglement in Neural Audio Codec
要約 ニューラル オーディオ コーデックは、連続オーディオ信号を個別のトークンに … 続きを読む
The Sounds of Home: A Speech-Removed Residential Audio Dataset for Sound Event Detection
要約 この論文では、高齢者の幸福を促進することを目的としたスマート ホーム アプ … 続きを読む