-
最近の投稿
- Counter-Hypothetical Particle Filters for Single Object Pose Tracking
- Robust High-Speed State Estimation for Off-road Navigation using Radar Velocity Factors
- A Propagation Perspective on Recursive Forward Dynamics for Systems with Kinematic Loops
- D2S: Representing sparse descriptors and 3D coordinates for camera relocalization
- Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments
-
最近のコメント
表示できるコメントはありません。 cs.AI (28533) cs.CL (21568) cs.CR (2228) cs.CV (35151) cs.LG (33295) cs.RO (16470) cs.SY (2535) eess.IV (4282) eess.SY (2529) stat.ML (4465)
「eess.AS」カテゴリーアーカイブ
Sound to Visual Scene Generation by Audio-to-Visual Latent Alignment
要約 オーディオは私たちの周りの世界をどのように説明しますか? 本論文では,音か … 続きを読む
Hindi as a Second Language: Improving Visually Grounded Speech with Semantically Similar Samples
要約 この作業の目的は、多言語の観点から視覚的に接地された音声モデル (VGS) … 続きを読む
Context-aware Fine-tuning of Self-supervised Speech Models
要約 自己監視型の事前トレーニング済みトランスフォーマーは、さまざまな音声タスク … 続きを読む
Physics-Driven Diffusion Models for Impact Sound Synthesis from Videos
要約 物理的なオブジェクトの相互作用から発せられる音をモデリングすることは、現実 … 続きを読む
Cluster-Guided Unsupervised Domain Adaptation for Deep Speaker Embedding
要約 最近の研究では、疑似ラベルが話者検証のための教師なしドメイン適応 (UDA … 続きを読む
Translate the Beauty in Songs: Jointly Learning to Align Melody and Translate Lyrics
要約 歌の翻訳では、歌詞の翻訳と音符の配置の両方が必要になるため、結果の詩が付随 … 続きを読む
Egocentric Auditory Attention Localization in Conversations
要約 ディナー パーティーなどの騒がしい会話環境では、人々は選択的な聴覚的注意を … 続きを読む
Partially Adaptive Multichannel Joint Reduction of Ego-noise and Environmental Noise
要約 人間とロボットの相互作用は、環境ノイズや自己誘導ノイズ、いわゆる自我ノイズ … 続きを読む
Cross-utterance ASR Rescoring with Graph-based Label Propagation
要約 発話間の音響的類似性を活用することにより、グラフベースのラベル伝播を使用し … 続きを読む
Wave-U-Net Discriminator: Fast and Lightweight Discriminator for Generative Adversarial Network-Based Speech Synthesis
要約 音声合成では、ミニマックス ゲームで生成器 (音声合成器) と弁別器をトレ … 続きを読む