-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations
要約 模倣学習はロボットに器用なスキルを教える効率的な方法を提供します。 ただし … 続きを読む
DynaWeightPnP: Toward global real-time 3D-2D solver in PnP without correspondences
要約 この論文では、特殊な Perspective-n-Point (PnP) … 続きを読む
Compact 3D Gaussian Splatting For Dense Visual SLAM
要約 最近の研究では、3D ガウス ベースの SLAM により、高品質の再構成、 … 続きを読む
TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation
要約 脚式ナビゲーションは通常、オープンワールド、オフロード、および困難な環境内 … 続きを読む
From One to the Power of Many: Augmentations for Invariance to Multi-LiDAR Perception from Single-Sensor Datasets
要約 最近、ディープ ニューラル ネットワークを活用した自動運転車用の LiDA … 続きを読む
FracGM: A Fast Fractional Programming Technique for Geman-McClure Robust Estimator
要約 コンピューター ビジョン、ロボット工学、ナビゲーションでは確実な推定が不可 … 続きを読む
TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation
要約 視覚-言語-動作 (VLA) モデルは、エンドツーエンドの学習プロセスを通 … 続きを読む
2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?
要約 共同スピーチのジェスチャーはコミュニケーションの基本です。 最近の深層学習 … 続きを読む
Hierarchical Windowed Graph Attention Network and a Large Scale Dataset for Isolated Indian Sign Language Recognition
要約 自動手話 (SL) 認識は、コンピューター ビジョン コミュニティにおける … 続きを読む
Learning from Pattern Completion: Self-supervised Controllable Generation
要約 人間の脳は、通常は情報を監視することなく、スケッチや落書きを現実世界の視覚 … 続きを読む