-
最近の投稿
- Learn With Imagination: Safe Set Guided State-wise Constrained Policy Optimization
- Effects of Muscle Synergy during Overhead Work with a Passive Shoulder Exoskeleton: A Case Study
- Development of a Low-Cost Prosthetic Hand Using Electromyography and Machine Learning
- Teaching Shortest Path Algorithms With a Robot and Overlaid Projections
- Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly
-
最近のコメント
表示できるコメントはありません。 cs.AI (30124) cs.CL (22755) cs.CR (2336) cs.CV (36490) cs.LG (34945) cs.RO (17504) cs.SY (2689) eess.IV (4444) eess.SY (2683) stat.ML (4656)
「eess.AS」カテゴリーアーカイブ
Simulating Articulatory Trajectories with Phonological Feature Interpolation
要約 知覚-生成ループを含む音声学習の完全な計算モデルに向けた最初のステップとし … 続きを読む
Articulatory Configurations across Genders and Periods in French Radio and TV archives
要約 この論文では、音響パラメータから調音パラメータへの反転を使用して、性別およ … 続きを読む
BAST: Binaural Audio Spectrogram Transformer for Binaural Sound Localization
要約 残響環境における正確な音の定位は、人間の聴覚にとって不可欠です。 最近、畳 … 続きを読む
Speech-MASSIVE: A Multilingual Speech Dataset for SLU and Beyond
要約 我々は、MASSIVE テキスト コーパスの一部の音声対応物を構成する多言 … 続きを読む
EchoTrack: Auditory Referring Multi-Object Tracking for Autonomous Driving
要約 本稿では、音声表現に基づいてビデオシーケンス内の特定のオブジェクトを動的に … 続きを読む
MMTrail: A Multimodal Trailer Video Dataset with Language and Music Descriptions
要約 大規模なマルチモダリティ データセットは、大規模なビデオ言語モデルの成功を … 続きを読む
Stem-JEPA: A Joint-Embedding Predictive Architecture for Musical Stem Compatibility Estimation
要約 この論文では、特定の音楽コンテキストとよく調和する単一の楽器の音声録音を特 … 続きを読む
An approach to optimize inference of the DIART speaker diarization pipeline
要約 話者ダイアライゼーションは、音声ファイルについて「誰がいつ話したか」という … 続きを読む
Clustering and Mining Accented Speech for Inclusive and Fair Speech Recognition
要約 最新の自動音声認識 (ASR) システムは通常、数万時間以上の音声データに … 続きを読む