cs.CV」カテゴリーアーカイブ

Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation

要約 Instance Image-Goal Navigation(IIN)では … 続きを読む

カテゴリー: cs.CV, cs.RO | Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation はコメントを受け付けていません

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

要約 私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models はコメントを受け付けていません

MapBERT: Bitwise Masked Modeling for Real-Time Semantic Mapping Generation

要約 空間認識は、具体化されたエージェントにとって重要な機能であり、観察されてい … 続きを読む

カテゴリー: cs.CV, cs.RO | MapBERT: Bitwise Masked Modeling for Real-Time Semantic Mapping Generation はコメントを受け付けていません

MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations

要約 LLMSの出現と他のデータモダリティとの統合により、マルチモーダル3D知覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations はコメントを受け付けていません

BitVLA: 1-bit Vision-Language-Action Models for Robotics Manipulation

要約 Vision-Language-active(VLA)モデルは、幅広いロボ … 続きを読む

カテゴリー: cs.CV, cs.RO | BitVLA: 1-bit Vision-Language-Action Models for Robotics Manipulation はコメントを受け付けていません

An Overview of the Burer-Monteiro Method for Certifiable Robot Perception

要約 このペーパーでは、ロボット認識の問題をリアルタイムで実証可能な最適性に解決 … 続きを読む

カテゴリー: 49, 68, cs.CV, cs.LG, cs.RO, I.4.0 | An Overview of the Burer-Monteiro Method for Certifiable Robot Perception はコメントを受け付けていません

R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation

要約 自律運転(AD)システムの検証には、多様で安全性の高いテストが必要であり、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation はコメントを受け付けていません

PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement

要約 最近のビデオ生成の進歩にもかかわらず、既存のモデルは、特に一貫したアイデン … 続きを読む

カテゴリー: cs.AI, cs.CV | PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement はコメントを受け付けていません

LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds

要約 私たちは、トレーニングで人間のラベルを必要とせずに、生のポイント雲の監視さ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds はコメントを受け付けていません

FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity

要約 この論文では、3Dシーンのジオメトリ、外観、および基礎となる物理学を純粋に … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.CV, cs.LG, cs.RO | FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity はコメントを受け付けていません