cs.CV」カテゴリーアーカイブ

PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models

要約 テキストまたは画像を 3D に変換するジェネレーターと 3D スキャナーで … 続きを読む

カテゴリー: cs.CV | PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models はコメントを受け付けていません

Video-Panda: Parameter-efficient Alignment for Encoder-free Video-Language Models

要約 私たちは、計算オーバーヘッドを大幅に削減しながら競争力のあるパフォーマンス … 続きを読む

カテゴリー: cs.CV | Video-Panda: Parameter-efficient Alignment for Encoder-free Video-Language Models はコメントを受け付けていません

Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders

要約 最近の 3D コンテンツ生成パイプラインは、拡散ベースの生成のために形状を … 続きを読む

カテゴリー: cs.CV | Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders はコメントを受け付けていません

Open-Vocabulary Mobile Manipulation Based on Double Relaxed Contrastive Learning with Dense Labeling

要約 人手不足の深刻化により、さまざまな環境を支援する家庭用サービスロボット(D … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | Open-Vocabulary Mobile Manipulation Based on Double Relaxed Contrastive Learning with Dense Labeling はコメントを受け付けていません

Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models

要約 Foundation Vision Language Models (VL … 続きを読む

カテゴリー: cs.CV, cs.RO | Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models はコメントを受け付けていません

LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding

要約 3D シーンを理解するためにガウス スプラッティングを知覚タスクに適用する … 続きを読む

カテゴリー: cs.CV | LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding はコメントを受け付けていません

SOUS VIDE: Cooking Visual Drone Navigation Policies in a Gaussian Splatting Vacuum

要約 私たちは、エンドツーエンドの視覚的なドローン ナビゲーションのための新しい … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | SOUS VIDE: Cooking Visual Drone Navigation Policies in a Gaussian Splatting Vacuum はコメントを受け付けていません

CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction

要約 ロボットの視覚運動ポリシー学習において、拡散ベースのモデルは、従来の自己回 … 続きを読む

カテゴリー: cs.CV, cs.RO | CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction はコメントを受け付けていません

Open-Vocabulary Mobile Manipulation Based on Double Relaxed Contrastive Learning with Dense Labeling

要約 人手不足の深刻化により、さまざまな環境を支援する家庭用サービスロボット(D … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | Open-Vocabulary Mobile Manipulation Based on Double Relaxed Contrastive Learning with Dense Labeling はコメントを受け付けていません

OLiDM: Object-aware LiDAR Diffusion Models for Autonomous Driving

要約 複雑なシナリオで自動運転の安全性を高めるために、LiDAR 点群データをシ … 続きを読む

カテゴリー: cs.CV, cs.RO | OLiDM: Object-aware LiDAR Diffusion Models for Autonomous Driving はコメントを受け付けていません