cs.CV」カテゴリーアーカイブ

3rd Workshop on Maritime Computer Vision (MaCVi) 2025: Challenge Results

要約 2025 年海洋コンピュータ ビジョン (MaCVi) に関する第 3 回 … 続きを読む

カテゴリー: cs.AI, cs.CV | 3rd Workshop on Maritime Computer Vision (MaCVi) 2025: Challenge Results はコメントを受け付けていません

Zero-Shot Monocular Scene Flow Estimation in the Wild

要約 大規模なモデルは、深度推定などの多くの低レベル視覚タスクについてデータセッ … 続きを読む

カテゴリー: cs.CV | Zero-Shot Monocular Scene Flow Estimation in the Wild はコメントを受け付けていません

FaceXBench: Evaluating Multimodal LLMs on Face Understanding

要約 マルチモーダル大規模言語モデル (MLLM) は、幅広いタスクやドメインに … 続きを読む

カテゴリー: cs.CV | FaceXBench: Evaluating Multimodal LLMs on Face Understanding はコメントを受け付けていません

Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications

要約 SLAM は、ロボット工学や AR/VR に幅広く応用できる基礎的な技術で … 続きを読む

カテゴリー: cs.CV, cs.RO | Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications はコメントを受け付けていません

Instruction-Guided Fusion of Multi-Layer Visual Features in Large Vision-Language Models

要約 大規模ビジョン言語モデル (LVLM) は、事前トレーニングされたビジョン … 続きを読む

カテゴリー: cs.CV, cs.LG | Instruction-Guided Fusion of Multi-Layer Visual Features in Large Vision-Language Models はコメントを受け付けていません

MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning

要約 ビデオ因果推論は、因果関係の観点からビデオを高度に理解することを目的として … 続きを読む

カテゴリー: cs.CV | MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning はコメントを受け付けていません

Embodied Scene Understanding for Vision Language Models via MetaVQA

要約 ビジョン言語モデル (VLM) は、さまざまなモビリティ アプリケーション … 続きを読む

カテゴリー: cs.CV, cs.RO | Embodied Scene Understanding for Vision Language Models via MetaVQA はコメントを受け付けていません

Unified Few-shot Crack Segmentation and its Precise 3D Automatic Measurement in Concrete Structures

要約 視覚空間システムは、コンクリートのひび割れ検査においてますます不可欠になっ … 続きを読む

カテゴリー: cs.CV, cs.RO | Unified Few-shot Crack Segmentation and its Precise 3D Automatic Measurement in Concrete Structures はコメントを受け付けていません

Are Open-Vocabulary Models Ready for Detection of MEP Elements on Construction Sites

要約 建設業界は長い間ロボット工学とコンピュータービジョンを研究してきましたが、 … 続きを読む

カテゴリー: cs.CV, cs.RO | Are Open-Vocabulary Models Ready for Detection of MEP Elements on Construction Sites はコメントを受け付けていません

Efficient Few-Shot Medical Image Analysis via Hierarchical Contrastive Vision-Language Learning

要約 医用画像分類における少数ショット学習には、利用可能な注釈付きデータの制限と … 続きを読む

カテゴリー: cs.CL, cs.CV | Efficient Few-Shot Medical Image Analysis via Hierarchical Contrastive Vision-Language Learning はコメントを受け付けていません