-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models
要約 テキストまたは画像を 3D に変換するジェネレーターと 3D スキャナーで … 続きを読む
カテゴリー: cs.CV
PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models はコメントを受け付けていません
Video-Panda: Parameter-efficient Alignment for Encoder-free Video-Language Models
要約 私たちは、計算オーバーヘッドを大幅に削減しながら競争力のあるパフォーマンス … 続きを読む
カテゴリー: cs.CV
Video-Panda: Parameter-efficient Alignment for Encoder-free Video-Language Models はコメントを受け付けていません
Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders
要約 最近の 3D コンテンツ生成パイプラインは、拡散ベースの生成のために形状を … 続きを読む
カテゴリー: cs.CV
Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders はコメントを受け付けていません
Open-Vocabulary Mobile Manipulation Based on Double Relaxed Contrastive Learning with Dense Labeling
要約 人手不足の深刻化により、さまざまな環境を支援する家庭用サービスロボット(D … 続きを読む
Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models
要約 Foundation Vision Language Models (VL … 続きを読む
LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding
要約 3D シーンを理解するためにガウス スプラッティングを知覚タスクに適用する … 続きを読む
カテゴリー: cs.CV
LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding はコメントを受け付けていません
SOUS VIDE: Cooking Visual Drone Navigation Policies in a Gaussian Splatting Vacuum
要約 私たちは、エンドツーエンドの視覚的なドローン ナビゲーションのための新しい … 続きを読む
CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction
要約 ロボットの視覚運動ポリシー学習において、拡散ベースのモデルは、従来の自己回 … 続きを読む
Open-Vocabulary Mobile Manipulation Based on Double Relaxed Contrastive Learning with Dense Labeling
要約 人手不足の深刻化により、さまざまな環境を支援する家庭用サービスロボット(D … 続きを読む
OLiDM: Object-aware LiDAR Diffusion Models for Autonomous Driving
要約 複雑なシナリオで自動運転の安全性を高めるために、LiDAR 点群データをシ … 続きを読む