-
最近の投稿
- Learning Multimodal Latent Dynamics for Human-Robot Interaction
- Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving
- Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation
- Demonstration Sidetracks: Categorizing Systematic Non-Optimality in Human Demonstrations
- Sensor Model Identification via Simultaneous Model Selection and State Variable Determination
-
最近のコメント
表示できるコメントはありません。 cs.AI (39679) cs.CL (30032) cs.CV (45003) cs.HC (3029) cs.LG (44613) cs.RO (23728) cs.SY (3617) eess.IV (5159) eess.SY (3609) stat.ML (5797)
「I.2.10」カテゴリーアーカイブ
MoSAR: Monocular Semi-Supervised Model for Avatar Reconstruction using Differentiable Shading
要約 ポートレート画像からアバターを再構成することは、マルチメディアに多くの用途 … 続きを読む
Vertical Federated Alzheimer’s Detection on Multimodal Data
要約 医療技術が急速に進歩する時代において、医療データの細分化は避けられず、分散 … 続きを読む
Intrinsic Image Diffusion for Single-view Material Estimation
要約 屋内シーンの外観分解の生成モデルである Intrinsic Image D … 続きを読む
nuScenes Knowledge Graph — A comprehensive semantic representation of traffic scenes for trajectory prediction
要約 交通シーンにおける軌道予測には、周囲の車両の挙動を正確に予測することが含ま … 続きを読む
Hacking Generative Models with Differentiable Network Bending
要約 この研究では、生成モデルを「ハッキング」し、その出力を元のトレーニング分布 … 続きを読む
Multiview Aerial Visual Recognition (MAVREC): Can Multi-view Improve Aerial Visual Perception?
要約 UAV が商業的に豊富にあるにもかかわらず、航空データの取得は依然として困 … 続きを読む
Invariance is Key to Generalization: Examining the Role of Representation in Sim-to-Real Transfer for Visual Navigation
要約 ロボット制御へのデータ駆動型アプローチは急速に進展しているが、未知のタスク … 続きを読む
Object Detector Differences when using Synthetic and Real Training Data
要約 性能の良い汎化ニューラルネットワークを訓練するためには、十分に大規模で多様 … 続きを読む
Vulnerability of Automatic Identity Recognition to Audio-Visual Deepfakes
要約 ディープフェイク検出の課題は、音声や視覚の研究者によって解決されるには程遠 … 続きを読む
FutureHuman3D: Forecasting Complex Long-Term 3D Human Behavior from Video Observations
要約 我々は、容易に利用可能な 2D 人間の行動データからの弱い監視のみを必要と … 続きを読む