-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers
要約 近年のディープラーニング技術の進歩により、マルチモーダルな医療データに基づ … 続きを読む
Hold Me Tight: Stable Encoder-Decoder Design for Speech Enhancement
要約 1 次元フィルターを備えた畳み込み層は、オーディオ信号をエンコードするため … 続きを読む
SelectTTS: Synthesizing Anyone’s Voice via Discrete Unit-Based Frame Selection
要約 見えない話者の音声を合成することは、複数話者のテキスト読み上げ (TTS) … 続きを読む
Towards Achieving Human Parity on End-to-end Simultaneous Speech Translation via LLM Agent
要約 この論文では、高品質で人間のような同時音声翻訳 (SiST) システムであ … 続きを読む
Contextualized Automatic Speech Recognition with Dynamic Vocabulary
要約 ディープ バイアス (DB) は、バイアス リストを使用して、まれな単語や … 続きを読む
Codec Does Matter: Exploring the Semantic Shortcoming of Codec for Audio Language Model
要約 オーディオ生成における最近の進歩は、大規模言語モデル (LLM) の機能に … 続きを読む
AASIST3: KAN-Enhanced AASIST Speech Deepfake Detection using SSL Features and Additional Regularization for the ASVspoof 2024 Challenge
要約 音声の特徴に基づいて話者を識別する自動話者認証 (ASV) システムは、金 … 続きを読む
Advancing Multi-talker ASR Performance with Large Language Models
要約 会話シナリオで複数の話者から重複する音声を認識することは、自動音声認識 ( … 続きを読む
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
要約 言語モデルの最近の進歩は大幅な進歩を遂げています。 GPT-4o は新たな … 続きを読む
Towards Efficient Modelling of String Dynamics: A Comparison of State Space and Koopman based Deep Learning Methods
要約 この論文では、線形および非線形の両方の硬いストリングのダイナミクスをモデル … 続きを読む
カテゴリー: cs.LG, cs.SD, eess.AS, physics.comp-ph
Towards Efficient Modelling of String Dynamics: A Comparison of State Space and Koopman based Deep Learning Methods はコメントを受け付けていません