eess.AS」カテゴリーアーカイブ

The Pipeline System of ASR and NLU with MLM-based Data Augmentation toward STOP Low-resource Challenge

要約 【タイトル】MLMベースのデータ拡張によるASRおよびNLUのパイプライン … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The Pipeline System of ASR and NLU with MLM-based Data Augmentation toward STOP Low-resource Challenge はコメントを受け付けていません

A Study on the Integration of Pipeline and E2E SLU systems for Spoken Semantic Parsing toward STOP Quality Challenge

要約 タイトル:STOP Quality Challengeのためのスポークンセ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | A Study on the Integration of Pipeline and E2E SLU systems for Spoken Semantic Parsing toward STOP Quality Challenge はコメントを受け付けていません

Self-supervised learning for infant cry analysis

要約 タイトル:自己教師付き学習による幼児の泣き声分析 要約: – … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Self-supervised learning for infant cry analysis はコメントを受け付けていません

Long-Term Rhythmic Video Soundtracker

要約 タイトル:長期リズミックビデオサウンドトラッカー 要約: – … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Long-Term Rhythmic Video Soundtracker はコメントを受け付けていません

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

要約 タイトル:臨床設定における自動音声認識パフォーマンスの改善に向けたClin … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings はコメントを受け付けていません

Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition

要約 タイトル: 「階層的ソフトマックスを用いたエンドツーエンドでの低資源多言語 … 続きを読む

カテゴリー: cs.CL, eess.AS | Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition はコメントを受け付けていません

YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot Voice Conversion for everyone

要約 タイトル: YourTTS: Zero-Shot Multi-Speake … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot Voice Conversion for everyone はコメントを受け付けていません

Joint Modelling of Spoken Language Understanding Tasks with Integrated Dialog History

要約 タイトル:統合対話履歴を用いた発話理解タスクの共同モデル化 要約: &#8 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Joint Modelling of Spoken Language Understanding Tasks with Integrated Dialog History はコメントを受け付けていません

Content Adaptive Front End For Audio Signal Processing

要約 【タイトル】オーディオ信号処理のためのコンテンツ適応型フロントエンド 【要 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | Content Adaptive Front End For Audio Signal Processing はコメントを受け付けていません

Transformer-based Sequence Labeling for Audio Classification based on MFCCs

要約 タイトル Transformer-based Sequence Label … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Transformer-based Sequence Labeling for Audio Classification based on MFCCs はコメントを受け付けていません