-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation
要約 既存の統一モデルは、視覚言語理解やテキストから画像への生成では高い性能を発 … 続きを読む
FlySearch: Exploring how vision-language models explore
要約 現実の世界は混乱しており、構造化されていない。重要な情報を発見するためには … 続きを読む
VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion
要約 脚式ロボットのロコモーションにおける最近の成功は、強化学習と物理シミュレー … 続きを読む
Grasp2Grasp: Vision-Based Dexterous Grasp Translation via Schrödinger Bridges
要約 我々は、視覚に基づく器用な把持変換の新しいアプローチを提案する。このアプロ … 続きを読む
HiLO: High-Level Object Fusion for Autonomous Driving using Transformers
要約 センサデータのフュージョンは、自律走行におけるロバストな環境認識のために不 … 続きを読む
BEVCALIB: LiDAR-Camera Calibration via Geometry-Guided Bird’s-Eye View Representations
要約 正確なLiDAR-カメラキャリブレーションは、自律走行やロボットシステムに … 続きを読む
Rodrigues Network for Learning Robot Actions
要約 ロボットの学習において、多関節動作の理解と予測は重要である。しかし、MLP … 続きを読む
GeneA-SLAM2: Dynamic SLAM with AutoEncoder-Preprocessed Genetic Keypoints Resampling and Depth Variance-Guided Dynamic Region Removal
要約 動的環境における既存のセマンティックSLAMは、主に物体検出またはセマンテ … 続きを読む
X-Driver: Explainable Autonomous Driving with Vision-Language Models
要約 エンド・ツー・エンドの自律走行は著しく進歩しており、従来のパイプラインより … 続きを読む
Self-supervised Learning of Event-guided Video Frame Interpolation for Rolling Shutter Frames
要約 ほとんどの民生用カメラはローリングシャッター(RS)露光を使用しているため … 続きを読む