「cs.CV」カテゴリーアーカイブ

3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations

投稿日: 2024年9月30日作成者: jarxiv

要約模倣学習はロボットに器用なスキルを教える効率的な方法を提供します。ただし … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

DynaWeightPnP: Toward global real-time 3D-2D solver in PnP without correspondences

投稿日: 2024年9月30日作成者: jarxiv

要約この論文では、特殊な Perspective-n-Point (PnP) … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Compact 3D Gaussian Splatting For Dense Visual SLAM

投稿日: 2024年9月30日作成者: jarxiv

要約最近の研究では、3D ガウスベースの SLAM により、高品質の再構成、 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation

投稿日: 2024年9月30日作成者: jarxiv

要約脚式ナビゲーションは通常、オープンワールド、オフロード、および困難な環境内 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

From One to the Power of Many: Augmentations for Invariance to Multi-LiDAR Perception from Single-Sensor Datasets

投稿日: 2024年9月30日作成者: jarxiv

要約最近、ディープニューラルネットワークを活用した自動運転車用の LiDA … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

FracGM: A Fast Fractional Programming Technique for Geman-McClure Robust Estimator

投稿日: 2024年9月30日作成者: jarxiv

要約コンピュータービジョン、ロボット工学、ナビゲーションでは確実な推定が不可 … 続きを読む →

カテゴリー: cs.CV, cs.RO, math.OC | コメントを受け付けていません

TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation

投稿日: 2024年9月30日作成者: jarxiv

要約視覚-言語-動作 (VLA) モデルは、エンドツーエンドの学習プロセスを通 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?

投稿日: 2024年9月30日作成者: jarxiv

要約共同スピーチのジェスチャーはコミュニケーションの基本です。最近の深層学習 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Hierarchical Windowed Graph Attention Network and a Large Scale Dataset for Isolated Indian Sign Language Recognition

投稿日: 2024年9月30日作成者: jarxiv

要約自動手話 (SL) 認識は、コンピュータービジョンコミュニティにおける … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Learning from Pattern Completion: Self-supervised Controllable Generation

投稿日: 2024年9月30日作成者: jarxiv

要約人間の脳は、通常は情報を監視することなく、スケッチや落書きを現実世界の視覚 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations

DynaWeightPnP: Toward global real-time 3D-2D solver in PnP without correspondences

Compact 3D Gaussian Splatting For Dense Visual SLAM

TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation

From One to the Power of Many: Augmentations for Invariance to Multi-LiDAR Perception from Single-Sensor Datasets

FracGM: A Fast Fractional Programming Technique for Geman-McClure Robust Estimator

TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation

2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?

Hierarchical Windowed Graph Attention Network and a Large Scale Dataset for Isolated Indian Sign Language Recognition

Learning from Pattern Completion: Self-supervised Controllable Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー