-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Improving Speech Emotion Recognition with Unsupervised Speaking Style Transfer
要約 人間は、強勢の配置や感情の強さなど、さまざまな韻律属性を簡単に変更して、一 … 続きを読む
Relationship between auditory and semantic entrainment using Deep Neural Networks (DNN)
要約 人々が相互作用するときに、同様の、一致する、または同期した行動をする傾向は … 続きを読む
Augmenting conformers with structured state-space sequence models for online speech recognition
要約 モデルが左側のコンテキストにのみアクセスするオンライン音声認識は、ASR … 続きを読む
Audio Generation with Multiple Conditional Diffusion Model
要約 テキストベースのオーディオ生成モデルには、オーディオ内のすべての情報を網羅 … 続きを読む
Cross-Lingual Transfer Learning for Low-Resource Speech Translation
要約 この論文では、自動音声翻訳の下流アプリケーションにおいて、高リソース言語か … 続きを読む
Neural Speaker Diarization Using Memory-Aware Multi-Speaker Embedding with Sequence-to-Sequence Architecture
要約 我々は、メモリ認識マルチスピーカー埋め込み(MA-MSE)とシーケンスツー … 続きを読む
The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge
要約 この文書は、車載マルチチャネル自動音声認識に関する ICMC-ASR チャ … 続きを読む
Auto deep learning for bioacoustic signals
要約 この研究では、従来の手動で設計されたディープ ラーニング モデルと比較して … 続きを読む
Transavs: End-To-End Audio-Visual Segmentation With Transformer
要約 オーディオビジュアルセグメンテーション (AVS) は、オーディオ信号を調 … 続きを読む
The Effects of Signal-to-Noise Ratio on Generative Adversarial Networks Applied to Marine Bioacoustic Data
要約 近年、敵対的生成ネットワーク (GAN) は、海洋生物音響学の分野でデータ … 続きを読む