-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Reliable-loc: Robust sequential LiDAR global localization in large-scale street scenes based on verifiable cues
要約 ウェアラブルレーザースキャン(WLS)システムには、柔軟性と移植性の利点が … 続きを読む
Inverse++: Vision-Centric 3D Semantic Occupancy Prediction Assisted with 3D Object Detection
要約 3Dセマンティック占有率予測は、オンボードサラウンドビューカメラを使用した … 続きを読む
Grounding 3D Object Affordance with Language Instructions, Visual Observations and Interactions
要約 接地3Dオブジェクトアフォーダンスは、操作できる3Dスペースにオブジェクト … 続きを読む
Continuous Locomotive Crowd Behavior Generation
要約 群衆の行動のモデリングと再現は、心理学、ロボット工学、輸送工学、仮想環境な … 続きを読む
Embracing Dynamics: Dynamics-aware 4D Gaussian Splatting SLAM
要約 同時ローカリゼーションとマッピング(SLAM)テクノロジーには、3Dガウス … 続きを読む
Open-Vocabulary Action Localization with Iterative Visual Prompting
要約 ビデオアクションローカリゼーションは、長いビデオから特定のアクションのタイ … 続きを読む
A Taxonomy of Self-Handover
要約 自分の手の間にオブジェクトを転送する自己携帯は、一般的ではあるが理解されて … 続きを読む
CloSE: A Compact Shape- and Orientation-Agnostic Cloth State Representation
要約 布の操作は、主に布の非剛性の性質のために困難な問題であり、これが変形の良い … 続きを読む
Towards Visual Text Grounding of Multimodal Large Language Model
要約 マルチモーダル大手言語モデル(MLLMS)の既存の進化にもかかわらず、特に … 続きを読む
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
要約 熱赤外ビデオで複数の無人航空機(UAV)を検出および追跡することは、コント … 続きを読む