eess.AS」カテゴリーアーカイブ

SLUE Phase-2: A Benchmark Suite of Diverse Spoken Language Understanding Tasks

要約 音声言語理解 (SLU) タスクは、音声研究コミュニティで何十年も研究され … 続きを読む

カテゴリー: cs.CL, eess.AS | SLUE Phase-2: A Benchmark Suite of Diverse Spoken Language Understanding Tasks はコメントを受け付けていません

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition

要約 対照学習ベースの事前トレーニング方法は、最近、さまざまな分野で目覚ましい成 … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition はコメントを受け付けていません

Investigating the Utility of Surprisal from Large Language Models for Speech Synthesis Prosody

要約 この論文では、音声合成韻律を支援する機能として、特定の文脈における単語の予 … 続きを読む

カテゴリー: cs.CL, eess.AS | Investigating the Utility of Surprisal from Large Language Models for Speech Synthesis Prosody はコメントを受け付けていません

On Data Sampling Strategies for Training Neural Network Speech Separation Models

要約 音声分離は依然としてマルチスピーカー信号処理の重要な領域です。 ディープ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE, cs.SD, eess.AS | On Data Sampling Strategies for Training Neural Network Speech Separation Models はコメントを受け付けていません

Evaluation of Speech Representations for MOS prediction

要約 この論文では、音声品質を予測するための特徴抽出モデルを評価します。 また、 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Evaluation of Speech Representations for MOS prediction はコメントを受け付けていません

Auto-AVSR: Audio-Visual Speech Recognition with Automatic Labels

要約 オーディオビジュアル音声認識は、音響ノイズに対する堅牢性により多くの注目を … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Auto-AVSR: Audio-Visual Speech Recognition with Automatic Labels はコメントを受け付けていません

RealImpact: A Dataset of Impact Sound Fields for Real Objects

要約 物体は、さまざまな摂動、環境条件、リスナーに対する姿勢の下で独特の音を出し … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.SD, eess.AS | RealImpact: A Dataset of Impact Sound Fields for Real Objects はコメントを受け付けていません

Few-shot bioacoustic event detection at the DCASE 2023 challenge

要約 フューショット生体音響イベント検出では、対象クラスの少数の例のみにアクセス … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Few-shot bioacoustic event detection at the DCASE 2023 challenge はコメントを受け付けていません

Pushing the Limits of Unsupervised Unit Discovery for SSL Speech Representation

要約 音声基礎モデルの自己教師あり学習 (SSL) の優れた一般化能力が大きな注 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Pushing the Limits of Unsupervised Unit Discovery for SSL Speech Representation はコメントを受け付けていません

Inconsistency Ranking-based Noisy Label Detection for High-quality Data

要約 ディープラーニングを成功させるには、注釈付きの高品質で大量のデータが必要で … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Inconsistency Ranking-based Noisy Label Detection for High-quality Data はコメントを受け付けていません