-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
Side Eye: Characterizing the Limits of POV Acoustic Eavesdropping from Smartphone Cameras with Rolling Shutters and Movable Lenses
要約 私たちの研究では、スマートフォンのカメラに広く見られるローリング シャッタ … 続きを読む
SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning
要約 3D 環境向けのオンザフライ ジオメトリベースのオーディオ レンダリングの … 続きを読む
Novel-View Acoustic Synthesis
要約 新規ビュー音響合成 (NVAS) タスクを紹介します。ソースの視点で観察さ … 続きを読む
Novel-View Acoustic Synthesis
要約 新規ビュー音響合成 (NVAS) タスクを導入します。ソースの視点で観察さ … 続きを読む
Speech Driven Video Editing via an Audio-Conditioned Diffusion Model
要約 この論文では、ノイズ除去拡散モデルを使用した、エンドツーエンドの音声駆動ビ … 続きを読む
Audio-Visual Efficient Conformer for Robust Speech Recognition
要約 ニューラルネットワークに基づくエンドツーエンドの自動音声認識(ASR)シス … 続きを読む
Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving Sounds
要約 オーディオビジュアルナビゲーションは、視覚と聴覚を組み合わせて、地図に載っ … 続きを読む
Feature Dropout: Revisiting the Role of Augmentations in Contrastive Learning
要約 対照学習においてオーグメンテーションはどのような役割を果たしますか? 最近 … 続きを読む
Expression-preserving face frontalization improves visually assisted speech processing
要約 顔の正面化は、任意に見た顔から正面から見た顔を合成することで構成されます。 … 続きを読む