-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「cs.SD」カテゴリーアーカイブ
A Semi-Automatic Approach to Create Large Gender- and Age-Balanced Speaker Corpora: Usefulness of Speaker Diarization & Identification
要約 この論文では、32 のカテゴリ (2 つの性別、4 つの年齢層、4 つの録 … 続きを読む
The LuViRA Dataset: Synchronized Vision, Radio, and Audio Sensors for Indoor Localization
要約 私たちは、正確かつ堅牢な屋内位置特定のための同期された多感覚データセット、 … 続きを読む
Audio-Visual Person Verification based on Recursive Fusion of Joint Cross-Attention
要約 顔と声が互いに密接に関連しているため、視聴覚融合を使用した個人または身元確 … 続きを読む
Automatic Speech Recognition System-Independent Word Error Rate Estimation
要約 単語誤り率 (WER) は、自動音声認識 (ASR) システムによって生成 … 続きを読む
Developing Acoustic Models for Automatic Speech Recognition in Swedish
要約 この論文は、訓練可能なシステムを使用した自動連続音声認識に関するものです。 … 続きを読む
ActiveRIR: Active Audio-Visual Exploration for Acoustic Environment Modeling
要約 環境音響モデルは、特定の音源/受信機の場所において、音が屋内環境の物理的特 … 続きを読む
STaR: Distilling Speech Temporal Relation for Lightweight Speech Self-Supervised Learning Models
要約 Transformer ベースの音声自己教師あり学習 (SSL) モデルは … 続きを読む
Automatic Speech Recognition System-Independent Word Error Rate Estimatio
要約 単語誤り率 (WER) は、自動音声認識 (ASR) システムによって生成 … 続きを読む
AV-RIR: Audio-Visual Room Impulse Response Estimation
要約 環境の音響特性を捉える室内インパルス応答 (RIR) の正確な推定は、音声 … 続きを読む
Voice Passing : a Non-Binary Voice Gender Prediction System for evaluating Transgender voice transition
要約 この論文では、連続音声女性性パーセント (VFP) を使用して音声を記述す … 続きを読む