eess.AS」カテゴリーアーカイブ

Simple yet Effective Code-Switching Language Identification with Multitask Pre-Training and Transfer Learning

要約 コードスイッチング (コードミキシングとも呼ばれる) は、カジュアルな環境 … 続きを読む

カテゴリー: cs.CL, eess.AS | Simple yet Effective Code-Switching Language Identification with Multitask Pre-Training and Transfer Learning はコメントを受け付けていません

MT4SSL: Boosting Self-Supervised Speech Representation Learning by Integrating Multiple Targets

要約 この論文では、トレーニングターゲットがどのように取得されるかということから … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | MT4SSL: Boosting Self-Supervised Speech Representation Learning by Integrating Multiple Targets はコメントを受け付けていません

Attention-Based Methods For Audio Question Answering

要約 音声質問応答 (AQA) は、システムに音声および自然言語の質問が提供され … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Attention-Based Methods For Audio Question Answering はコメントを受け付けていません

ViLaS: Integrating Vision and Language into Automatic Speech Recognition

要約 追加のマルチモーダル情報を使用して自動音声認識 (ASR) のパフォーマン … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | ViLaS: Integrating Vision and Language into Automatic Speech Recognition はコメントを受け付けていません

Leveraging Semantic Information for Efficient Self-Supervised Emotion Recognition with Audio-Textual Distilled Models

要約 主に、暗黙的なセマンティック モデリングにより、自己教師あり学習 (SSL … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Leveraging Semantic Information for Efficient Self-Supervised Emotion Recognition with Audio-Textual Distilled Models はコメントを受け付けていません

MiniSUPERB: Lightweight Benchmark for Self-supervised Speech Models

要約 自己教師あり学習 (SSL) は、音声処理における人気の研究トピックです。 … 続きを読む

カテゴリー: cs.CL, cs.LG, eess.AS | MiniSUPERB: Lightweight Benchmark for Self-supervised Speech Models はコメントを受け付けていません

Debiased Automatic Speech Recognition for Dysarthric Speech via Sample Reweighting with Sample Affinity Test

要約 深層学習に基づく自動音声認識システムは、主に経験的リスク最小化 (ERM) … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Debiased Automatic Speech Recognition for Dysarthric Speech via Sample Reweighting with Sample Affinity Test はコメントを受け付けていません

BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR

要約 最近提案されたシリアル化出力トレーニング (SOT) は、特殊なトークンで … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR はコメントを受け付けていません

A Stutter Seldom Comes Alone — Cross-Corpus Stuttering Detection as a Multi-label Problem

要約 吃音の検出と分類の研究のほとんどは、吃音を多クラスの分類問題、または流暢性 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | A Stutter Seldom Comes Alone — Cross-Corpus Stuttering Detection as a Multi-label Problem はコメントを受け付けていません

Towards single integrated spoofing-aware speaker verification embeddings

要約 この研究は、2 つの側面を満たす単一の統合されたなりすまし対応話者検証 ( … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Towards single integrated spoofing-aware speaker verification embeddings はコメントを受け付けていません