-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning
要約 3D 環境向けのオンザフライ ジオメトリベースのオーディオ レンダリングの … 続きを読む
Novel-View Acoustic Synthesis
要約 新規ビュー音響合成 (NVAS) タスクを紹介します。ソースの視点で観察さ … 続きを読む
Novel-View Acoustic Synthesis
要約 新規ビュー音響合成 (NVAS) タスクを導入します。ソースの視点で観察さ … 続きを読む
Speech Driven Video Editing via an Audio-Conditioned Diffusion Model
要約 この論文では、ノイズ除去拡散モデルを使用した、エンドツーエンドの音声駆動ビ … 続きを読む
Audio-Visual Efficient Conformer for Robust Speech Recognition
要約 ニューラルネットワークに基づくエンドツーエンドの自動音声認識(ASR)シス … 続きを読む
Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving Sounds
要約 オーディオビジュアルナビゲーションは、視覚と聴覚を組み合わせて、地図に載っ … 続きを読む
Feature Dropout: Revisiting the Role of Augmentations in Contrastive Learning
要約 対照学習においてオーグメンテーションはどのような役割を果たしますか? 最近 … 続きを読む
Expression-preserving face frontalization improves visually assisted speech processing
要約 顔の正面化は、任意に見た顔から正面から見た顔を合成することで構成されます。 … 続きを読む
Vision Transformers are Parameter-Efficient Audio-Visual Learners
要約 ビジョン トランスフォーマー (ViT) は、過去数年間にさまざまなコンピ … 続きを読む