cs.SD」カテゴリーアーカイブ

A Semi-Automatic Approach to Create Large Gender- and Age-Balanced Speaker Corpora: Usefulness of Speaker Diarization & Identification

要約 この論文では、32 のカテゴリ (2 つの性別、4 つの年齢層、4 つの録 … 続きを読む

カテゴリー: cs.CL, cs.DL, cs.LG, cs.SD, eess.AS | A Semi-Automatic Approach to Create Large Gender- and Age-Balanced Speaker Corpora: Usefulness of Speaker Diarization & Identification はコメントを受け付けていません

The LuViRA Dataset: Synchronized Vision, Radio, and Audio Sensors for Indoor Localization

要約 私たちは、正確かつ堅牢な屋内位置特定のための同期された多感覚データセット、 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS, eess.SP | The LuViRA Dataset: Synchronized Vision, Radio, and Audio Sensors for Indoor Localization はコメントを受け付けていません

Audio-Visual Person Verification based on Recursive Fusion of Joint Cross-Attention

要約 顔と声が互いに密接に関連しているため、視聴覚融合を使用した個人または身元確 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Audio-Visual Person Verification based on Recursive Fusion of Joint Cross-Attention はコメントを受け付けていません

Automatic Speech Recognition System-Independent Word Error Rate Estimation

要約 単語誤り率 (WER) は、自動音声認識 (ASR) システムによって生成 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Automatic Speech Recognition System-Independent Word Error Rate Estimation はコメントを受け付けていません

Developing Acoustic Models for Automatic Speech Recognition in Swedish

要約 この論文は、訓練可能なシステムを使用した自動連続音声認識に関するものです。 … 続きを読む

カテゴリー: 68T10, cs.AI, cs.SD, eess.AS, I.2.0 | Developing Acoustic Models for Automatic Speech Recognition in Swedish はコメントを受け付けていません

ActiveRIR: Active Audio-Visual Exploration for Acoustic Environment Modeling

要約 環境音響モデルは、特定の音源/受信機の場所において、音が屋内環境の物理的特 … 続きを読む

カテゴリー: cs.CV, cs.RO, cs.SD, eess.AS | ActiveRIR: Active Audio-Visual Exploration for Acoustic Environment Modeling はコメントを受け付けていません

STaR: Distilling Speech Temporal Relation for Lightweight Speech Self-Supervised Learning Models

要約 Transformer ベースの音声自己教師あり学習 (SSL) モデルは … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | STaR: Distilling Speech Temporal Relation for Lightweight Speech Self-Supervised Learning Models はコメントを受け付けていません

Automatic Speech Recognition System-Independent Word Error Rate Estimatio

要約 単語誤り率 (WER) は、自動音声認識 (ASR) システムによって生成 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Automatic Speech Recognition System-Independent Word Error Rate Estimatio はコメントを受け付けていません

AV-RIR: Audio-Visual Room Impulse Response Estimation

要約 環境の音響特性を捉える室内インパルス応答 (RIR) の正確な推定は、音声 … 続きを読む

カテゴリー: cs.CV, cs.SD | AV-RIR: Audio-Visual Room Impulse Response Estimation はコメントを受け付けていません

Voice Passing : a Non-Binary Voice Gender Prediction System for evaluating Transgender voice transition

要約 この論文では、連続音声女性性パーセント (VFP) を使用して音声を記述す … 続きを読む

カテゴリー: cs.HC, cs.LG, cs.SD, eess.AS | Voice Passing : a Non-Binary Voice Gender Prediction System for evaluating Transgender voice transition はコメントを受け付けていません