-
最近の投稿
- Open-Structure: Structural Benchmark Dataset for SLAM Algorithms
- Goal Inference from Open-Ended Dialog
- Learning a Stable, Safe, Distributed Feedback Controller for a Heterogeneous Platoon of Autonomous Vehicles
- MarineFormer: A Transformer-based Navigation Policy Model for Collision Avoidance in Marine Environment
- RecoveryChaining: Learning Local Recovery Policies for Robust Manipulation
-
最近のコメント
表示できるコメントはありません。 cs.AI (28338) cs.CL (21411) cs.CR (2212) cs.CV (34970) cs.LG (33082) cs.RO (16320) cs.SY (2507) eess.IV (4260) eess.SY (2501) stat.ML (4433)
「eess.AS」カテゴリーアーカイブ
3D-Speaker: A Large-Scale Multi-Device, Multi-Distance, and Multi-Dialect Corpus for Speech Representation Disentanglement
要約 音声発話内の相関関係のない情報を解きほぐすことは、音声コミュニティ内での重 … 続きを読む
WACO: Word-Aligned Contrastive Learning for Speech Translation
要約 エンドツーエンド音声翻訳 (E2E ST) は、ソース音声をターゲット テ … 続きを読む
Cross-Language Speech Emotion Recognition Using Multimodal Dual Attention Transformers
要約 音声感情認識 (SER) は最近進歩しているにもかかわらず、最先端のシステ … 続きを読む
Cross-Attention is Not Enough: Incongruity-Aware Hierarchical Multimodal Sentiment Analysis and Emotion Recognition
要約 感情的なコンピューティング タスクに複数のモダリティを融合することは、パフ … 続きを読む
3D-Speaker: A Large-Scale Multi-Device, Multi-Distance, and Multi-Dialect Corpus for Speech Representation Disentanglement
要約 音声発話内の相関関係のない情報を解きほぐすことは、音声コミュニティ内での重 … 続きを読む
Debiased Automatic Speech Recognition for Dysarthric Speech via Sample Reweighting with Sample Affinity Test
要約 深層学習に基づく自動音声認識システムは、主に経験的リスク最小化 (ERM) … 続きを読む
Iterative autoregression: a novel trick to improve your low-latency speech enhancement model
要約 ストリーミング モデルは、リアルタイム音声強調ツールの重要なコンポーネント … 続きを読む
Large-scale unsupervised audio pre-training for video-to-speech synthesis
要約 ビデオ音声合成は、話者の無声ビデオから音声信号を再構築するタスクです。 こ … 続きを読む
Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3
要約 このレポートでは、サウンド デミキシング チャレンジ 2023 の音楽デミ … 続きを読む
Addressing Cold Start Problem for End-to-end Automatic Speech Scoring
要約 自動音声採点/評価システムの統合は、第二言語スピーキング教育の重要な側面と … 続きを読む