cs.CV」カテゴリーアーカイブ

Space-Aware Instruction Tuning: Dataset and Benchmark for Guide Dog Robots Assisting the Visually Impaired

要約 盲導犬ロボットは、視覚障害のある個人のモビリティと安全性を高めるための有望 … 続きを読む

カテゴリー: cs.CV, cs.RO | Space-Aware Instruction Tuning: Dataset and Benchmark for Guide Dog Robots Assisting the Visually Impaired はコメントを受け付けていません

Open-Nav: Exploring Zero-Shot Vision-and-Language Navigation in Continuous Environment with Open-Source LLMs

要約 Vision and-Language Navigation(VLN)タス … 続きを読む

カテゴリー: cs.CV, cs.RO | Open-Nav: Exploring Zero-Shot Vision-and-Language Navigation in Continuous Environment with Open-Source LLMs はコメントを受け付けていません

Space-Aware Instruction Tuning: Dataset and Benchmark for Guide Dog Robots Assisting the Visually Impaired

要約 盲導犬ロボットは、視覚障害のある個人のモビリティと安全性を高めるための有望 … 続きを読む

カテゴリー: cs.CV, cs.RO | Space-Aware Instruction Tuning: Dataset and Benchmark for Guide Dog Robots Assisting the Visually Impaired はコメントを受け付けていません

HAMSTER: Hierarchical Action Models For Open-World Robot Manipulation

要約 大規模な基礎モデルは、ビジョンと言語の複雑な問題に対して強いオープンワール … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | HAMSTER: Hierarchical Action Models For Open-World Robot Manipulation はコメントを受け付けていません

TRAVEL: Training-Free Retrieval and Alignment for Vision-and-Language Navigation

要約 この作業では、最先端の大型言語モデル(LLM)とビジョン言語モデル(VLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | TRAVEL: Training-Free Retrieval and Alignment for Vision-and-Language Navigation はコメントを受け付けていません

Autonomous Driving using Spiking Neural Networks on Dynamic Vision Sensor Data: A Case Study of Traffic Light Change Detection

要約 自律運転は、学界と産業の両方から幅広い注目を集めてきた挑戦的な作業です。 … 続きを読む

カテゴリー: cs.CV, cs.NE, cs.RO, eess.IV | Autonomous Driving using Spiking Neural Networks on Dynamic Vision Sensor Data: A Case Study of Traffic Light Change Detection はコメントを受け付けていません

Navigating Semantic Drift in Task-Agnostic Class-Incremental Learning

要約 クラスインクリメンテルラーニング(CIL)は、モデルが以前に学んだ知識の知 … 続きを読む

カテゴリー: cs.CV | Navigating Semantic Drift in Task-Agnostic Class-Incremental Learning はコメントを受け付けていません

An Elliptic Curve Based Solution to the Perspective-Three-Point Problem

要約 視点3点問題(P3P)は、カメラから制御ポイントまでの距離ではなく、カメラ … 続きを読む

カテゴリー: 14H52, 51M10, cs.CV, math.AG | An Elliptic Curve Based Solution to the Perspective-Three-Point Problem はコメントを受け付けていません

Finding Dino: A Plug-and-Play Framework for Zero-Shot Detection of Out-of-Distribution Objects Using Prototypes

要約 あらゆるシーンで不明または分散排出(OOD)オブジェクトを検出およびローカ … 続きを読む

カテゴリー: cs.AI, cs.CV | Finding Dino: A Plug-and-Play Framework for Zero-Shot Detection of Out-of-Distribution Objects Using Prototypes はコメントを受け付けていません

Interpretable Vision-Language Survival Analysis with Ordinal Inductive Bias for Computational Pathology

要約 組織病理学総合画像(WSI)は、計算病理学(CPATH)の癌予後を評価する … 続きを読む

カテゴリー: cs.CV | Interpretable Vision-Language Survival Analysis with Ordinal Inductive Bias for Computational Pathology はコメントを受け付けていません