-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion
要約 透明な物体の知覚は、多くのロボットタスクに不可欠である。しかし、複雑な光学 … 続きを読む
カテゴリー: cs.CV
Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion はコメントを受け付けていません
NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM
要約 Vision-and-Language Navigation (VLN)は … 続きを読む
Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis
要約 目的:手術ワークフローの解析は、手術の効率と安全性を向上させるために極めて … 続きを読む
Annotation-Free Curb Detection Leveraging Altitude Difference Image
要約 道路の縁石は、自律走行車の安全性を確保するために不可欠な、重要かつどこにで … 続きを読む
カテゴリー: cs.CV
Annotation-Free Curb Detection Leveraging Altitude Difference Image はコメントを受け付けていません
MATCH POLICY: A Simple Pipeline from Point Cloud Registration to Manipulation Policies
要約 マニピュレーションタスクの多くは、ロボットが物体を相対的に再配置することを … 続きを読む
Evaluating Intelligence via Trial and Error
要約 知能は、限られた回数の試行錯誤の中で解決策を見出す種にとって重要な特性であ … 続きを読む
EchoONE: Segmenting Multiple echocardiography Planes in One Model
要約 臨床における心エコー検査では、心疾患のスクリーニング、診断、治療において、 … 続きを読む
カテゴリー: cs.CV
EchoONE: Segmenting Multiple echocardiography Planes in One Model はコメントを受け付けていません
Stereo Hand-Object Reconstruction for Human-to-Robot Handover
要約 手と物体の形状を共同で推定することで、人間からロボットへのハンドオーバーに … 続きを読む
Towards Physically Realizable Adversarial Attacks in Embodied Vision Navigation
要約 具現化ビジョンナビゲーションの大幅な進歩により、ディープニューラルネットワ … 続きを読む
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key
要約 幻覚は、大規模視覚言語モデル(LVLM)にとって依然として大きな課題である … 続きを読む
カテゴリー: cs.CV
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key はコメントを受け付けていません