cs.CV」カテゴリーアーカイブ

Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion

要約 透明な物体の知覚は、多くのロボットタスクに不可欠である。しかし、複雑な光学 … 続きを読む

カテゴリー: cs.CV | Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion はコメントを受け付けていません

NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM

要約 Vision-and-Language Navigation (VLN)は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM はコメントを受け付けていません

Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis

要約 目的:手術ワークフローの解析は、手術の効率と安全性を向上させるために極めて … 続きを読む

カテゴリー: cs.AI, cs.CV | Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis はコメントを受け付けていません

Annotation-Free Curb Detection Leveraging Altitude Difference Image

要約 道路の縁石は、自律走行車の安全性を確保するために不可欠な、重要かつどこにで … 続きを読む

カテゴリー: cs.CV | Annotation-Free Curb Detection Leveraging Altitude Difference Image はコメントを受け付けていません

MATCH POLICY: A Simple Pipeline from Point Cloud Registration to Manipulation Policies

要約 マニピュレーションタスクの多くは、ロボットが物体を相対的に再配置することを … 続きを読む

カテゴリー: cs.CV, cs.RO | MATCH POLICY: A Simple Pipeline from Point Cloud Registration to Manipulation Policies はコメントを受け付けていません

Evaluating Intelligence via Trial and Error

要約 知能は、限られた回数の試行錯誤の中で解決策を見出す種にとって重要な特性であ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | Evaluating Intelligence via Trial and Error はコメントを受け付けていません

EchoONE: Segmenting Multiple echocardiography Planes in One Model

要約 臨床における心エコー検査では、心疾患のスクリーニング、診断、治療において、 … 続きを読む

カテゴリー: cs.CV | EchoONE: Segmenting Multiple echocardiography Planes in One Model はコメントを受け付けていません

Stereo Hand-Object Reconstruction for Human-to-Robot Handover

要約 手と物体の形状を共同で推定することで、人間からロボットへのハンドオーバーに … 続きを読む

カテゴリー: cs.CV, cs.RO | Stereo Hand-Object Reconstruction for Human-to-Robot Handover はコメントを受け付けていません

Towards Physically Realizable Adversarial Attacks in Embodied Vision Navigation

要約 具現化ビジョンナビゲーションの大幅な進歩により、ディープニューラルネットワ … 続きを読む

カテゴリー: cs.CV, cs.RO | Towards Physically Realizable Adversarial Attacks in Embodied Vision Navigation はコメントを受け付けていません

Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key

要約 幻覚は、大規模視覚言語モデル(LVLM)にとって依然として大きな課題である … 続きを読む

カテゴリー: cs.CV | Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key はコメントを受け付けていません