-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation
要約 Instance Image-Goal Navigation(IIN)では … 続きを読む
From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models
要約 私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む
MapBERT: Bitwise Masked Modeling for Real-Time Semantic Mapping Generation
要約 空間認識は、具体化されたエージェントにとって重要な機能であり、観察されてい … 続きを読む
MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations
要約 LLMSの出現と他のデータモダリティとの統合により、マルチモーダル3D知覚 … 続きを読む
BitVLA: 1-bit Vision-Language-Action Models for Robotics Manipulation
要約 Vision-Language-active(VLA)モデルは、幅広いロボ … 続きを読む
An Overview of the Burer-Monteiro Method for Certifiable Robot Perception
要約 このペーパーでは、ロボット認識の問題をリアルタイムで実証可能な最適性に解決 … 続きを読む
R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation
要約 自律運転(AD)システムの検証には、多様で安全性の高いテストが必要であり、 … 続きを読む
PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement
要約 最近のビデオ生成の進歩にもかかわらず、既存のモデルは、特に一貫したアイデン … 続きを読む
LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds
要約 私たちは、トレーニングで人間のラベルを必要とせずに、生のポイント雲の監視さ … 続きを読む