-
最近の投稿
- A Data-Driven Modeling and Motion Control of Heavy-Load Hydraulic Manipulators via Reversible Transformation
- Data-Driven Multi-step Nonlinear Model Predictive Control for Industrial Heavy Load Hydraulic Robot
- Image Compression Using Novel View Synthesis Priors
- OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments
- t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving
-
最近のコメント
表示できるコメントはありません。 cs.AI (29990) cs.CL (22653) cs.CR (2325) cs.CV (36362) cs.LG (34812) cs.RO (17416) cs.SY (2673) eess.IV (4425) eess.SY (2667) stat.ML (4642)
「eess.AS」カテゴリーアーカイブ
HLTCOE JHU Submission to the Voice Privacy Challenge 2024
要約 我々は、kNN-VC 法や WavLM 音声変換法などの音声変換ベースのシ … 続きを読む
Clean Label Attacks against SLU Systems
要約 ポイズニング バックドア攻撃では、攻撃者がトレーニング データを操作して、 … 続きを読む
Biomimetic Frontend for Differentiable Audio Processing
要約 オーディオおよび音声処理のモデルはより深く、よりエンドツーエンドになってい … 続きを読む
Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions
要約 大規模言語モデル (LLM) の最近の進歩はさまざまな領域に革命をもたらし … 続きを読む
LA-RAG:Enhancing LLM-based ASR Accuracy with Retrieval-Augmented Generation
要約 音声情報を大規模言語モデル (LLM) に統合する最近の進歩により、自動音 … 続きを読む
Investigating Disentanglement in a Phoneme-level Speech Codec for Prosody Modeling
要約 音声韻律モデリングにおける一般的なアプローチのほとんどは、参照音声の属性を … 続きを読む
NEST-RQ: Next Token Prediction for Speech Self-Supervised Pre-Training
要約 音声の自己監視型事前トレーニングは、下流のタスクのパフォーマンスを効果的に … 続きを読む
Exploring SSL Discrete Speech Features for Zipformer-based Contextual ASR
要約 自己教師あり学習 (SSL) ベースの離散音声表現は非常にコンパクトで、ド … 続きを読む
Exploring SSL Discrete Tokens for Multilingual ASR
要約 音声関連タスクにおける自己教師あり学習 (SSL) の進歩に伴い、より高速 … 続きを読む
Exploring the Impact of Data Quantity on ASR in Extremely Low-resource Languages
要約 この研究では、絶滅危惧種の 2 つのオーストロネシア語、アミ語とセデクに焦 … 続きを読む