-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Canonical Cortical Graph Neural Networks and its Application for Speech Enhancement in Audio-Visual Hearing Aids
要約 最近の機械学習アルゴリズムの成功にもかかわらず、マルチモーダル入力データや … 続きを読む
Video Influencers: Unboxing the Mystique
要約 インフルエンサー マーケティングは、顧客にリーチするための非常に人気のある … 続きを読む
DiffMotion: Speech-Driven Gesture Synthesis Using Denoising Diffusion Model
要約 音声駆動のジェスチャ合成は、仮想人間の作成に対する関心が高まっている分野で … 続きを読む
Side Eye: Characterizing the Limits of POV Acoustic Eavesdropping from Smartphone Cameras with Rolling Shutters and Movable Lenses
要約 私たちの研究では、スマートフォンのカメラに広く見られるローリング シャッタ … 続きを読む
SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning
要約 3D 環境向けのオンザフライ ジオメトリベースのオーディオ レンダリングの … 続きを読む
Novel-View Acoustic Synthesis
要約 新規ビュー音響合成 (NVAS) タスクを紹介します。ソースの視点で観察さ … 続きを読む
Novel-View Acoustic Synthesis
要約 新規ビュー音響合成 (NVAS) タスクを導入します。ソースの視点で観察さ … 続きを読む
Speech Driven Video Editing via an Audio-Conditioned Diffusion Model
要約 この論文では、ノイズ除去拡散モデルを使用した、エンドツーエンドの音声駆動ビ … 続きを読む
Audio-Visual Efficient Conformer for Robust Speech Recognition
要約 ニューラルネットワークに基づくエンドツーエンドの自動音声認識(ASR)シス … 続きを読む
Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving Sounds
要約 オーディオビジュアルナビゲーションは、視覚と聴覚を組み合わせて、地図に載っ … 続きを読む