-
最近の投稿
- BlabberSeg: Real-Time Embedded Open-Vocabulary Aerial Segmentation
- Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks
- Risk Assessment for Autonomous Landing in Urban Environments using Semantic Segmentation
- Configurable Embodied Data Generation for Class-Agnostic RGB-D Video Segmentation
- RPCBF: Constructing Safety Filters Robust to Model Error and Disturbances via Policy Control Barrier Functions
-
最近のコメント
表示できるコメントはありません。 cs.AI (28260) cs.CL (21356) cs.CR (2207) cs.CV (34912) cs.LG (33009) cs.RO (16270) cs.SY (2503) eess.IV (4251) eess.SY (2497) stat.ML (4424)
「eess.AS」カテゴリーアーカイブ
Universal Automatic Phonetic Transcription into the International Phonetic Alphabet
要約 この論文では、あらゆる言語の音声を国際音声文字 (IPA) に転写するため … 続きを読む
Federated Representation Learning for Automatic Speech Recognition
要約 Federated Learning (FL) はプライバシーを保護するパ … 続きを読む
GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition
要約 対照学習ベースのクロスモダリティ事前トレーニング アプローチは、最近、さま … 続きを読む
Speech Separation based on Contrastive Learning and Deep Modularization
要約 現在のモノラルの最先端の音声分離ツールは教師あり学習に依存しています。 こ … 続きを読む
Comparative Analysis of the wav2vec 2.0 Feature Extractor
要約 自動音声認識 (ASR) システムは通常、手作りの特徴抽出パイプラインを使 … 続きを読む
Towards an AI to Win Ghana’s National Science and Maths Quiz
要約 AI はガーナの国家科学数学クイズ (NSMQ) に勝つことができるでしょ … 続きを読む
Finding Tori: Self-supervised Learning for Analyzing Korean Folk Song
要約 本論文では、1980-90年代に録音された約700時間の韓国民謡のフィール … 続きを読む
Federated Representation Learning for Automatic Speech Recognition
要約 Federated Learning(FL)はプライバシーを保護するパラダ … 続きを読む
Emo-DNA: Emotion Decoupling and Alignment Learning for Cross-Corpus Speech Emotion Recognition
要約 コーパス横断的音声感情認識(SER)は、ラベル付けされたコーパスからラベル … 続きを読む
Efficient Monaural Speech Enhancement using Spectrum Attention Fusion
要約 音声強調は、自動音声処理パイプラインにおける要求の厳しいタスクであり、ノイ … 続きを読む