-
最近の投稿
- FlowBotHD: History-Aware Diffuser Handling Ambiguities in Articulated Objects Manipulation
- A Novel Twisted-Winching String Actuator for Robotic Applications: Design and Validation
- Affordance-Centric Policy Learning: Sample Efficient and Generalisable Robot Policy Learning using Affordance-Centric Task Frames
- Sample-Efficient Reinforcement Learning with Temporal Logic Objectives: Leveraging the Task Specification to Guide Exploration
- Design Space Exploration of Embedded SoC Architectures for Real-Time Optimal Control
-
最近のコメント
表示できるコメントはありません。 cs.AI (28198) cs.CL (21301) cs.CR (2201) cs.CV (34856) cs.LG (32941) cs.RO (16224) cs.SY (2500) eess.IV (4250) eess.SY (2494) stat.ML (4412)
「cs.SD」カテゴリーアーカイブ
Learning Spatial Features from Audio-Visual Correspondence in Egocentric Videos
要約 私たちは、自己中心的なビデオにおける空間的な視聴覚対応に基づいて表現を学習 … 続きを読む
Roman Numeral Analysis with Graph Neural Networks: Onset-wise Predictions from Note-wise Features
要約 ローマ数字分析は、調性音楽のコードとその機能的コンテキストを特定する重要な … 続きを読む
ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit
要約 ESPnet-ST-v2 は、音声言語翻訳コミュニティの関心の拡大によって … 続きを読む
Gammatonegram Representation for End-to-End Dysarthric Speech Processing Tasks: Speech Recognition, Speaker Identification, and Intelligibility Assessment
要約 構音障害は、人間の音声システムに障害を引き起こし、音声の質と明瞭度を低下さ … 続きを読む
Token-Level Serialized Output Training for Joint Streaming ASR and ST Leveraging Textual Alignments
要約 実際のアプリケーションでは、特に増分生成が必要なストリーミング シナリオで … 続きを読む
WACO: Word-Aligned Contrastive Learning for Speech Translation
要約 エンドツーエンド音声翻訳 (E2E ST) は、ソース音声をターゲット テ … 続きを読む
LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT
要約 LyricWhiz は、ロックやメタルなどの難しいジャンルでも、さまざまな … 続きを読む
The Relationship Between Speech Features Changes When You Get Depressed: Feature Correlations for Improving Speed and Performance of Depression Detection
要約 この研究は、うつ病によって音声から抽出された特徴間の相関が変化することを示 … 続きを読む
Transfer Learning for the Efficient Detection of COVID-19 from Smartphone Audio Data
要約 スマートフォン データからの病気の検出は、モバイル ヘルス (m-heal … 続きを読む