「eess.AS」カテゴリーアーカイブ

Attention-Based Recurrent Neural Network For Automatic Behavior Laying Hen Recognition

投稿日: 2024年1月19日作成者: jarxiv

要約現代の養鶏の関心の 1 つは、健康行動に関する非常に有益な情報を含む産卵鶏 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech Recognition Challenge

投稿日: 2024年1月19日作成者: jarxiv

要約運転シナリオにおける音声処理と認識の研究を促進するために、私たちは ISC … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

FreGrad: Lightweight and Fast Frequency-aware Diffusion Vocoder

投稿日: 2024年1月19日作成者: jarxiv

要約この論文の目標は、FreGrad という軽量で高速な拡散ベースのボコーダー … 続きを読む →

カテゴリー: cs.AI, eess.AS, eess.SP | コメントを受け付けていません

RTFS-Net: Recurrent time-frequency modelling for efficient audio-visual speech separation

投稿日: 2024年1月19日作成者: jarxiv

要約視聴覚音声分離手法は、さまざまなモダリティを統合して高品質の分離音声を生成 … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Using i-vectors for subject-independent cross-session EEG transfer learning

投稿日: 2024年1月18日作成者: jarxiv

要約認知負荷分類は、脳波検査 (EEG) などの生理学的測定に基づいて、タスク … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS, q-bio.NC | コメントを受け付けていません

NOTSOFAR-1 Challenge: New Datasets, Baseline, and Tasks for Distant Meeting Transcription

投稿日: 2024年1月18日作成者: jarxiv

要約データセットとベースラインシステムとともに、遠距離音声録音 (「NOTS … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Efficient Adapter Finetuning for Tail Languages in Streaming Multilingual ASR

投稿日: 2024年1月18日作成者: jarxiv

要約エンドツーエンドの ASR モデルは、展開が容易であり、強力な基盤モデルな … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Multilingual DistilWhisper: Efficient Distillation of Multi-task Speech Models via Language-Specific Experts

投稿日: 2024年1月18日作成者: jarxiv

要約 Whisper は、99 言語をカバーするマルチタスクおよび多言語音声モデ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

SummaryMixing: A Linear-Complexity Alternative to Self-Attention for Speech Recognition and Understanding

投稿日: 2024年1月18日作成者: jarxiv

要約現代の音声処理システムは自己注意に依存しています。残念ながら、自己注意を … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue

投稿日: 2024年1月18日作成者: jarxiv

要約大規模言語モデル (LLM) は、チャット、推論、質問応答などのタスクにお … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Attention-Based Recurrent Neural Network For Automatic Behavior Laying Hen Recognition

ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech Recognition Challenge

FreGrad: Lightweight and Fast Frequency-aware Diffusion Vocoder

RTFS-Net: Recurrent time-frequency modelling for efficient audio-visual speech separation

Using i-vectors for subject-independent cross-session EEG transfer learning

NOTSOFAR-1 Challenge: New Datasets, Baseline, and Tasks for Distant Meeting Transcription

Efficient Adapter Finetuning for Tail Languages in Streaming Multilingual ASR

Multilingual DistilWhisper: Efficient Distillation of Multi-task Speech Models via Language-Specific Experts

SummaryMixing: A Linear-Complexity Alternative to Self-Attention for Speech Recognition and Understanding

Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue

最近の投稿

最近のコメント

アーカイブ

カテゴリー