「cs.CV」カテゴリーアーカイブ

Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation

投稿日: 2025年6月10日作成者: jarxiv

要約 Instance Image-Goal Navigation（IIN）では … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

投稿日: 2025年6月10日作成者: jarxiv

要約私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

MapBERT: Bitwise Masked Modeling for Real-Time Semantic Mapping Generation

投稿日: 2025年6月10日作成者: jarxiv

要約空間認識は、具体化されたエージェントにとって重要な機能であり、観察されてい … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations

投稿日: 2025年6月10日作成者: jarxiv

要約 LLMSの出現と他のデータモダリティとの統合により、マルチモーダル3D知覚 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

BitVLA: 1-bit Vision-Language-Action Models for Robotics Manipulation

投稿日: 2025年6月10日作成者: jarxiv

要約 Vision-Language-active（VLA）モデルは、幅広いロボ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

An Overview of the Burer-Monteiro Method for Certifiable Robot Perception

投稿日: 2025年6月10日作成者: jarxiv

要約このペーパーでは、ロボット認識の問題をリアルタイムで実証可能な最適性に解決 … 続きを読む →

カテゴリー: 49, 68, cs.CV, cs.LG, cs.RO, I.4.0 | コメントを受け付けていません

R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation

投稿日: 2025年6月10日作成者: jarxiv

要約自律運転（AD）システムの検証には、多様で安全性の高いテストが必要であり、 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement

投稿日: 2025年6月10日作成者: jarxiv

要約最近のビデオ生成の進歩にもかかわらず、既存のモデルは、特に一貫したアイデン … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds

投稿日: 2025年6月10日作成者: jarxiv

要約私たちは、トレーニングで人間のラベルを必要とせずに、生のポイント雲の監視さ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity

投稿日: 2025年6月10日作成者: jarxiv

要約この論文では、3Dシーンのジオメトリ、外観、および基礎となる物理学を純粋に … 続きを読む →

カテゴリー: cs.AI, cs.CE, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

MapBERT: Bitwise Masked Modeling for Real-Time Semantic Mapping Generation

MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations

BitVLA: 1-bit Vision-Language-Action Models for Robotics Manipulation

An Overview of the Burer-Monteiro Method for Certifiable Robot Perception

R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation

PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement

LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds

FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity

最近の投稿

最近のコメント

アーカイブ

カテゴリー