cs.CV」カテゴリーアーカイブ

VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment

要約 モノクラービデオから3Dシーンを効率的に再構築することは、仮想現実、ロボッ … 続きを読む

カテゴリー: cs.CV | VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment はコメントを受け付けていません

Alligat0R: Pre-Training Through Co-Visibility Segmentation for Relative Camera Pose Regression

要約 トレーニング前の手法は、コンピュータービジョンを大きく進めており、Croc … 続きを読む

カテゴリー: cs.CV | Alligat0R: Pre-Training Through Co-Visibility Segmentation for Relative Camera Pose Regression はコメントを受け付けていません

MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools

要約 世界を観察する能力は、環境と対話する方法について、推論と情報に基づいた決定 … 続きを読む

カテゴリー: cs.CV | MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools はコメントを受け付けていません

VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models

要約 この研究では、ビジョン言語モデル(VLM)によって示される明示的および暗黙 … 続きを読む

カテゴリー: cs.CL, cs.CV | VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models はコメントを受け付けていません

Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation

要約 拡散モデルは、多様な自然分布全体で高解像度の現実的な画像を生成することに顕 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation はコメントを受け付けていません

Robusto-1 Dataset: Comparing Humans and VLMs on real out-of-distribution Autonomous Driving VQA from Peru

要約 マルチモーダルの基礎モデルが自動運転車に実験的に展開され始めると、私たちが … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Robusto-1 Dataset: Comparing Humans and VLMs on real out-of-distribution Autonomous Driving VQA from Peru はコメントを受け付けていません

A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning

要約 事前に訓練されたビジョンモデル(PVM)は、最新のロボット工学の基本ですが … 続きを読む

カテゴリー: cs.CV, cs.RO | A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning はコメントを受け付けていません

Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition

要約 海上マルチシーン認識は、特に海洋保護、環境監視、災害対応などの用途で、イン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition はコメントを受け付けていません

Griffin: Aerial-Ground Cooperative Detection and Tracking Dataset and Benchmark

要約 大幅な進歩にもかかわらず、自律駆動システムは、単一視点センシングの固有の制 … 続きを読む

カテゴリー: cs.CV, cs.RO | Griffin: Aerial-Ground Cooperative Detection and Tracking Dataset and Benchmark はコメントを受け付けていません

RS2V-L: Vehicle-Mounted LiDAR Data Generation from Roadside Sensor Observations

要約 洗練された制御コマンドを直接生成してマルチモーダル感覚データを処理するエン … 続きを読む

カテゴリー: cs.CV, cs.RO | RS2V-L: Vehicle-Mounted LiDAR Data Generation from Roadside Sensor Observations はコメントを受け付けていません