「eess.AS」カテゴリーアーカイブ

SVDD Challenge 2024: A Singing Voice Deepfake Detection Challenge Evaluation Plan

投稿日: 2024年5月9日作成者: jarxiv

要約 AI によって生成された歌声の急速な進歩により、自然な人間の歌声が忠実に模 … 続きを読む →

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Adapting WavLM for Speech Emotion Recognition

投稿日: 2024年5月8日作成者: jarxiv

要約最近、下流タスクでの音声自己教師ありモデル (SSL) の使用が大きな注目 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Fine-grained Speech Sentiment Analysis in Chinese Psychological Support Hotlines Based on Large-scale Pre-trained Model

投稿日: 2024年5月8日作成者: jarxiv

要約自殺と自殺行為は、依然として公共政策と医療にとって重大な課題です。これに … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Deep Space Separable Distillation for Lightweight Acoustic Scene Classification

投稿日: 2024年5月7日作成者: jarxiv

要約音響シーン分類（ASC）は実世界において非常に重要である。近年、ディープラ … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets

投稿日: 2024年5月7日作成者: jarxiv

要約大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて比類のない有 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models

投稿日: 2024年5月7日作成者: jarxiv

要約汎化は、現在のオーディオ・ディープフェイク検出器の主な問題であり、分布外の … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Can We Identify Unknown Audio Recording Environments in Forensic Scenarios?

投稿日: 2024年5月6日作成者: jarxiv

要約録音された音声は、犯罪捜査において重要な証拠となる場合がある。その一つが、 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Joint sentiment analysis of lyrics and audio in music

投稿日: 2024年5月6日作成者: jarxiv

要約感情や気分は、音楽において様々なレベルで表現される。自動分析では通常、実際 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets

投稿日: 2024年5月6日作成者: jarxiv

要約大規模言語モデルは様々な自然言語処理タスクにおいて比類のない有効性を実証し … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

TIPAA-SSL: Text Independent Phone-to-Audio Alignment based on Self-Supervised Learning and Knowledge Transfer

投稿日: 2024年5月6日作成者: jarxiv

要約本論文では、音素認識、表現学習、知識移転に基づく、テキストに依存しない音声 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

SVDD Challenge 2024: A Singing Voice Deepfake Detection Challenge Evaluation Plan

Adapting WavLM for Speech Emotion Recognition

Fine-grained Speech Sentiment Analysis in Chinese Psychological Support Hotlines Based on Large-scale Pre-trained Model

Deep Space Separable Distillation for Lightweight Acoustic Scene Classification

Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets

Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models

Can We Identify Unknown Audio Recording Environments in Forensic Scenarios?

Joint sentiment analysis of lyrics and audio in music

Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets

TIPAA-SSL: Text Independent Phone-to-Audio Alignment based on Self-Supervised Learning and Knowledge Transfer

最近の投稿

最近のコメント

アーカイブ

カテゴリー