-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Towards Cross-device and Training-free Robotic Grasping in 3D Open World
要約 オープンワールドにおけるロボットによる把握は、製造および自動化プロセスの重 … 続きを読む
Online Knowledge Integration for 3D Semantic Mapping: A Survey
要約 セマンティック マッピングは、構造化された環境内で動作し、オブジェクトと対 … 続きを読む
Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving
要約 基盤モデルの急速なスケーリングが特徴的な時代において、自動運転技術は、デー … 続きを読む
SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation
要約 環境の高解像度 (HD) セマンティック マップの生成は、自動運転の重要な … 続きを読む
Don’t Let Your Robot be Harmful: Responsible Robotic Manipulation
要約 ロボット操作における人間の指示を考えずに実行すると、中毒、火災、さらには爆 … 続きを読む
Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning
要約 視覚言語モデル (VLM) は、マルチモーダル推論タスクにおいて目覚ましい … 続きを読む
MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement
要約 CT レポート生成 (CTRG) は、3D ボリュームの診断レポートを自動 … 続きを読む
Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation
要約 ステレオ深度推定における大幅な進歩にもかかわらず、主に適切なデータの欠如に … 続きを読む
Biometric Authentication Based on Enhanced Remote Photoplethysmography Signal Morphology
要約 遠隔光電脈波計 (rPPG) は、顔のビデオから心臓信号を測定する非接触方 … 続きを読む
TryOffDiff: Virtual-Try-Off via High-Fidelity Garment Reconstruction using Diffusion Models
要約 この論文では、衣服を着た個人の 1 枚の写真から標準化された衣服画像を生成 … 続きを読む