-
最近の投稿
- MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework
- SLLEN: Semantic-aware Low-light Image Enhancement Network
- TuneTables: Context Optimization for Scalable Prior-Data Fitted Networks
- Impact of Dataset Properties on Membership Inference Vulnerability of Deep Transfer Learning
- Joint Sensing and Semantic Communications with Multi-Task Deep Learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (28403) cs.CL (21462) cs.CR (2219) cs.CV (35034) cs.LG (33149) cs.RO (16370) cs.SY (2518) eess.IV (4266) eess.SY (2512) stat.ML (4445)
「eess.AS」カテゴリーアーカイブ
Simple yet Effective Code-Switching Language Identification with Multitask Pre-Training and Transfer Learning
要約 コードスイッチング (コードミキシングとも呼ばれる) は、カジュアルな環境 … 続きを読む
MT4SSL: Boosting Self-Supervised Speech Representation Learning by Integrating Multiple Targets
要約 この論文では、トレーニングターゲットがどのように取得されるかということから … 続きを読む
Attention-Based Methods For Audio Question Answering
要約 音声質問応答 (AQA) は、システムに音声および自然言語の質問が提供され … 続きを読む
ViLaS: Integrating Vision and Language into Automatic Speech Recognition
要約 追加のマルチモーダル情報を使用して自動音声認識 (ASR) のパフォーマン … 続きを読む
Leveraging Semantic Information for Efficient Self-Supervised Emotion Recognition with Audio-Textual Distilled Models
要約 主に、暗黙的なセマンティック モデリングにより、自己教師あり学習 (SSL … 続きを読む
MiniSUPERB: Lightweight Benchmark for Self-supervised Speech Models
要約 自己教師あり学習 (SSL) は、音声処理における人気の研究トピックです。 … 続きを読む
Debiased Automatic Speech Recognition for Dysarthric Speech via Sample Reweighting with Sample Affinity Test
要約 深層学習に基づく自動音声認識システムは、主に経験的リスク最小化 (ERM) … 続きを読む
BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR
要約 最近提案されたシリアル化出力トレーニング (SOT) は、特殊なトークンで … 続きを読む
A Stutter Seldom Comes Alone — Cross-Corpus Stuttering Detection as a Multi-label Problem
要約 吃音の検出と分類の研究のほとんどは、吃音を多クラスの分類問題、または流暢性 … 続きを読む
Towards single integrated spoofing-aware speaker verification embeddings
要約 この研究は、2 つの側面を満たす単一の統合されたなりすまし対応話者検証 ( … 続きを読む