cs.CV」カテゴリーアーカイブ

3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations

要約 模倣学習はロボットに器用なスキルを教える効率的な方法を提供します。 ただし … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | 3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations はコメントを受け付けていません

DynaWeightPnP: Toward global real-time 3D-2D solver in PnP without correspondences

要約 この論文では、特殊な Perspective-n-Point (PnP) … 続きを読む

カテゴリー: cs.CV, cs.RO | DynaWeightPnP: Toward global real-time 3D-2D solver in PnP without correspondences はコメントを受け付けていません

Compact 3D Gaussian Splatting For Dense Visual SLAM

要約 最近の研究では、3D ガウス ベースの SLAM により、高品質の再構成、 … 続きを読む

カテゴリー: cs.CV, cs.RO | Compact 3D Gaussian Splatting For Dense Visual SLAM はコメントを受け付けていません

TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation

要約 脚式ナビゲーションは通常、オープンワールド、オフロード、および困難な環境内 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO, cs.SY, eess.SY | TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation はコメントを受け付けていません

From One to the Power of Many: Augmentations for Invariance to Multi-LiDAR Perception from Single-Sensor Datasets

要約 最近、ディープ ニューラル ネットワークを活用した自動運転車用の LiDA … 続きを読む

カテゴリー: cs.CV, cs.RO | From One to the Power of Many: Augmentations for Invariance to Multi-LiDAR Perception from Single-Sensor Datasets はコメントを受け付けていません

FracGM: A Fast Fractional Programming Technique for Geman-McClure Robust Estimator

要約 コンピューター ビジョン、ロボット工学、ナビゲーションでは確実な推定が不可 … 続きを読む

カテゴリー: cs.CV, cs.RO, math.OC | FracGM: A Fast Fractional Programming Technique for Geman-McClure Robust Estimator はコメントを受け付けていません

TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation

要約 視覚-言語-動作 (VLA) モデルは、エンドツーエンドの学習プロセスを通 … 続きを読む

カテゴリー: cs.CV, cs.RO | TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation はコメントを受け付けていません

2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?

要約 共同スピーチのジェスチャーはコミュニケーションの基本です。 最近の深層学習 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | 2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation? はコメントを受け付けていません

Hierarchical Windowed Graph Attention Network and a Large Scale Dataset for Isolated Indian Sign Language Recognition

要約 自動手話 (SL) 認識は、コンピューター ビジョン コミュニティにおける … 続きを読む

カテゴリー: cs.CL, cs.CV | Hierarchical Windowed Graph Attention Network and a Large Scale Dataset for Isolated Indian Sign Language Recognition はコメントを受け付けていません

Learning from Pattern Completion: Self-supervised Controllable Generation

要約 人間の脳は、通常は情報を監視することなく、スケッチや落書きを現実世界の視覚 … 続きを読む

カテゴリー: cs.AI, cs.CV | Learning from Pattern Completion: Self-supervised Controllable Generation はコメントを受け付けていません