-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
DSVAE: Interpretable Disentangled Representation for Synthetic Speech Detection
要約 タイトル:DSVAE:合成音声検出のための解釈可能な分離表現 要約: &# … 続きを読む
Efficient Audio Captioning Transformer with Patchout and Text Guidance
要約 タイトル:Patchoutおよびテキストガイダンスを用いた効率的な音声キャ … 続きを読む
Zero-shot domain adaptation of anomalous samples for semi-supervised anomaly detection
要約 タイトル:ゼロショットドメイン適応による半教師あり異常検知の不審なサンプル … 続きを読む
On the Impact of Voice Anonymization on Speech-Based COVID-19 Detection
要約 タイトル: 音声匿名化が発話に基づくCOVID-19検出に与える影響につい … 続きを読む
Beyond Universal Transformer: block reusing with adaptor in Transformer for automatic speech recognition
要約 タイトル:Beyond Universal Transformer:自動音 … 続きを読む
Vision Transformers are Parameter-Efficient Audio-Visual Learners
要約 【タイトル】ビジョン・トランスフォーマーは効率的なパラメーターでオーディオ … 続きを読む
Dual-Attention Neural Transducers for Efficient Wake Word Spotting in Speech Recognition
要約 タイトル: 話者認識における二重注視ニューラルトランスデューサーによる効率 … 続きを読む
AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models
要約 タイトル: AUDIT: Audio Editing by Followi … 続きを読む
Dual-Attention Neural Transducers for Efficient Wake Word Spotting in Speech Recognition
要約 タイトル:音声認識における効率的なウェイクワード検出のためのデュアルアテン … 続きを読む
Learning to Dub Movies via Hierarchical Prosody Models
要約 タイトル:階層的プロソディモデルに基づく映画の吹き替え学習 要約: ・映画 … 続きを読む