-
最近の投稿
- FlowBotHD: History-Aware Diffuser Handling Ambiguities in Articulated Objects Manipulation
- A Novel Twisted-Winching String Actuator for Robotic Applications: Design and Validation
- Affordance-Centric Policy Learning: Sample Efficient and Generalisable Robot Policy Learning using Affordance-Centric Task Frames
- Sample-Efficient Reinforcement Learning with Temporal Logic Objectives: Leveraging the Task Specification to Guide Exploration
- Design Space Exploration of Embedded SoC Architectures for Real-Time Optimal Control
-
最近のコメント
表示できるコメントはありません。 cs.AI (28198) cs.CL (21301) cs.CR (2201) cs.CV (34856) cs.LG (32941) cs.RO (16224) cs.SY (2500) eess.IV (4250) eess.SY (2494) stat.ML (4412)
「cs.SD」カテゴリーアーカイブ
SLMGAN: Exploiting Speech Language Model Representations for Unsupervised Zero-Shot Voice Conversion in GANs
要約 近年、大規模な事前トレーニング済み音声言語モデル (SLM) により、テキ … 続きを読む
FlexiAST: Flexibility is What AST Needs
要約 この作業の目的は、オーディオ スペクトログラム トランスフォーマー (AS … 続きを読む
BASS: Block-wise Adaptation for Speech Summarization
要約 エンドツーエンドの音声要約は、カスケード ベースラインよりもパフォーマンス … 続きを読む
Multilingual Speech-to-Speech Translation into Multiple Target Languages
要約 Speech-to-Speech Translation (S2ST) に … 続きを読む
Semi-supervised cross-lingual speech emotion recognition
要約 単一言語での音声感情認識 (SER) のパフォーマンスは、深層学習技術の使 … 続きを読む
Leveraging Pretrained ASR Encoders for Effective and Efficient End-to-End Speech Intent Classification and Slot Filling
要約 私たちは、音声認識 (ASR) で事前トレーニングされたエンコーダを使用し … 続きを読む
The CHiME-7 DASR Challenge: Distant Meeting Transcription with Multiple Devices in Diverse Scenarios
要約 CHiME の課題は、堅牢な自動音声認識 (ASR) システムの開発と評価 … 続きを読む
Replay to Remember: Continual Layer-Specific Fine-tuning for German Speech Recognition
要約 自動音声認識 (ASR) モデルは、教師なしまたは自己教師ありトレーニング … 続きを読む
Towards dialect-inclusive recognition in a low-resource language: are balanced corpora the answer?
要約 ASR システムは通常、話し言葉の「標準」向けに構築されており、非標準の方 … 続きを読む
Cross-Language Speech Emotion Recognition Using Multimodal Dual Attention Transformers
要約 音声感情認識 (SER) は最近進歩しているにもかかわらず、最先端のシステ … 続きを読む