-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
「eess.AS」カテゴリーアーカイブ
Self-Supervised Learning of Music-Dance Representation through Explicit-Implicit Rhythm Synchronization
要約 視聴覚表現は多くの下流のタスクに適用可能であることが証明されていますが、よ … 続きを読む
Finding Fallen Objects Via Asynchronous Audio-Visual Integration
要約 オブジェクトの外観と音の仕方は、その物理的特性を補完的に反映しています。 … 続きを読む
Expression-preserving face frontalization improves visually assisted speech processing
要約 顔の正面化とは、任意の角度から見た顔から、正面から見た顔を合成することであ … 続きを読む
VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices
要約 この論文では、人間の顔と声を含むビデオの唇と声の同期の問題に対処します。 … 続きを読む
Show Me Your Face, And I’ll Tell You How You Speak
要約 私たちが話すとき、韻律とスピーチの内容は私たちの唇の動きから推測することが … 続きを読む
Incorporating Voice Instructions in Model-Based Reinforcement Learning for Self-Driving Cars
要約 このペーパーでは、自動運転車をトレーニングする際に、自然言語の音声命令をサ … 続きを読む
Rethinking Audio-visual Synchronization for Active Speaker Detection
要約 アクティブスピーカー検出(ASD)システムは、マルチトーカーの会話を分析す … 続きを読む
SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning
要約 3D環境向けのオンザフライのジオメトリベースのオーディオレンダリング用のプ … 続きを読む
VisageSynTalk: Unseen Speaker Video-to-Speech Synthesis via Speech-Visage Feature Selection
要約 この作品の目標は、静かに話す顔のビデオからスピーチを再構築することです。 … 続きを読む