-
最近の投稿
- Open-Structure: Structural Benchmark Dataset for SLAM Algorithms
- Goal Inference from Open-Ended Dialog
- Learning a Stable, Safe, Distributed Feedback Controller for a Heterogeneous Platoon of Autonomous Vehicles
- MarineFormer: A Transformer-based Navigation Policy Model for Collision Avoidance in Marine Environment
- RecoveryChaining: Learning Local Recovery Policies for Robust Manipulation
-
最近のコメント
表示できるコメントはありません。 cs.AI (28338) cs.CL (21411) cs.CR (2212) cs.CV (34970) cs.LG (33082) cs.RO (16320) cs.SY (2507) eess.IV (4260) eess.SY (2501) stat.ML (4433)
「eess.AS」カテゴリーアーカイブ
Self-supervised representations in speech-based depression detection
要約 この論文では、自己教師あり学習 (SSL) で事前トレーニングされた基礎モ … 続きを読む
Evaluating raw waveforms with deep learning frameworks for speech emotion recognition
要約 音声感情認識は、音声処理分野における困難なタスクです。 このため、特徴抽出 … 続きを読む
Audio-visual End-to-end Multi-channel Speech Separation, Dereverberation and Recognition
要約 重複する話者、騒音、残響を含むカクテル パーティーのスピーチを正確に認識す … 続きを読む
Broadcasted Residual Learning for Efficient Keyword Spotting
要約 キーワード スポッティングは、スマート デバイス上のデバイスのウェイクアッ … 続きを読む
Leveraging multilingual transfer for unsupervised semantic acoustic word embeddings
要約 音響単語埋め込み (AWE) は、同じ単語の異なる実現が同様の埋め込みを持 … 続きを読む
LOAF-M2L: Joint Learning of Wording and Formatting for Singable Melody-to-Lyric Generation
要約 メロディーから歌詞への生成に関するこれまでの研究にも関わらず、生成された歌 … 続きを読む
Flowchase: a Mobile Application for Pronunciation Training
要約 この論文では、音声の分節的特徴と超分節的特徴を分割および分析できる音声技術 … 続きを読む
Artificial ASMR: A Cyber-Psychological Approach
要約 ASMR (Autonomous Sensory Meridian Res … 続きを読む
AVSegFormer: Audio-Visual Segmentation with Transformer
要約 オーディオとビジョンの組み合わせは、マルチモーダル コミュニティで長い間注 … 続きを読む
An End-to-End Multi-Module Audio Deepfake Generation System for ADD Challenge 2023
要約 合成音声生成のタスクは、指定されたテキストから言語コンテンツを生成し、人間 … 続きを読む