「eess.AS」カテゴリーアーカイブ

W2KPE: Keyphrase Extraction with Word-Word Relation

投稿日: 2023年3月24日作成者: jarxiv

要約このペーパーでは、ICASSP 2023 MUG チャレンジトラック 4 … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

Automatic Severity Assessment of Dysarthric speech by using Self-supervised Model with Multi-task Learning

投稿日: 2023年3月24日作成者: jarxiv

要約持続的な治療とリハビリテーションには、構音障害の音声の自動評価が不可欠です … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Beyond Universal Transformer: block reusing with adaptor in Transformer for automatic speech recognit

投稿日: 2023年3月24日作成者: jarxiv

要約 Transformer ベースのモデルは、最近、エンドツーエンド (E2E … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Frame-Level Multi-Label Playing Technique Detection Using Multi-Scale Network and Self-Attention Mechanism

投稿日: 2023年3月24日作成者: jarxiv

要約楽器演奏技術 (IPT) は、音楽表現の重要な要素です。ただし、IPT … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Audio Diffusion Model for Speech Synthesis: A Survey on Text To Speech and Speech Enhancement in Generative AI

投稿日: 2023年3月24日作成者: jarxiv

要約ジェネレーティブ AI はさまざまな分野で印象的なパフォーマンスを発揮して … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Egocentric Audio-Visual Object Localization

投稿日: 2023年3月24日作成者: jarxiv

要約人間は、音と視覚を統合して一人称視点で周囲の景色を自然に知覚します。同様 … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Exploring Turkish Speech Recognition via Hybrid CTC/Attention Architecture and Multi-feature Fusion Network

投稿日: 2023年3月23日作成者: jarxiv

要約近年、ディープラーニングに基づくEnd-to-Endの音声認識技術が急速に … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Posthoc Interpretation via Quantization

投稿日: 2023年3月23日作成者: jarxiv

要約この論文では、訓練された分類器によって行われた決定を解釈するための、「量子 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

End-to-End Integration of Speech Separation and Voice Activity Detection for Low-Latency Diarization of Telephone Conversations

投稿日: 2023年3月22日作成者: jarxiv

要約最近の研究は、主に音声分離の最近の進歩のおかげで、音声分離誘導ダイアライゼ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Transformers in Speech Processing: A Survey

投稿日: 2023年3月22日作成者: jarxiv

要約自然言語処理の分野におけるトランスフォーマーの目覚ましい成功は、音声処理コ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

W2KPE: Keyphrase Extraction with Word-Word Relation

Automatic Severity Assessment of Dysarthric speech by using Self-supervised Model with Multi-task Learning

Beyond Universal Transformer: block reusing with adaptor in Transformer for automatic speech recognit

Frame-Level Multi-Label Playing Technique Detection Using Multi-Scale Network and Self-Attention Mechanism

Audio Diffusion Model for Speech Synthesis: A Survey on Text To Speech and Speech Enhancement in Generative AI

Egocentric Audio-Visual Object Localization

Exploring Turkish Speech Recognition via Hybrid CTC/Attention Architecture and Multi-feature Fusion Network

Posthoc Interpretation via Quantization

End-to-End Integration of Speech Separation and Voice Activity Detection for Low-Latency Diarization of Telephone Conversations

Transformers in Speech Processing: A Survey

最近の投稿

最近のコメント

アーカイブ

カテゴリー