-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Synthesizing audio from tongue motion during speech using tagged MRI via transformer
要約 タグ付けされた MRI から測定された舌の内部組織点の動きと口腔咽頭筋の変 … 続きを読む
The LuViRA Dataset: Measurement Description
要約 ビジョン、オーディオ、および無線センサーを利用するローカリゼーション アル … 続きを読む
Revisiting Pre-training in Audio-Visual Learning
要約 事前学習は、様々なタスクでモデルの性能を向上させるために大きな成功を収めて … 続きを読む
AV-NeRF: Learning Neural Fields for Real-World Audio-Visual Scene Synthesis
要約 複雑な世界に対する人間の知覚は、マルチモーダル信号の包括的な分析に依存して … 続きを読む
Leveraging Modality-specific Representations for Audio-visual Speech Recognition via Reinforcement Learning
要約 視聴覚音声認識 (AVSR) は、音声認識のノイズ ロバスト性を改善するた … 続きを読む
DiffMotion: Speech-Driven Gesture Synthesis Using Denoising Diffusion Model
要約 音声駆動のジェスチャ合成は、仮想人間の作成に対する関心が高まっている分野で … 続きを読む
Canonical Cortical Graph Neural Networks and its Application for Speech Enhancement in Audio-Visual Hearing Aids
要約 最近の機械学習アルゴリズムの成功にもかかわらず、マルチモーダル入力データや … 続きを読む
Video Influencers: Unboxing the Mystique
要約 インフルエンサー マーケティングは、顧客にリーチするための非常に人気のある … 続きを読む
DiffMotion: Speech-Driven Gesture Synthesis Using Denoising Diffusion Model
要約 音声駆動のジェスチャ合成は、仮想人間の作成に対する関心が高まっている分野で … 続きを読む
Side Eye: Characterizing the Limits of POV Acoustic Eavesdropping from Smartphone Cameras with Rolling Shutters and Movable Lenses
要約 私たちの研究では、スマートフォンのカメラに広く見られるローリング シャッタ … 続きを読む