「cs.CV」カテゴリーアーカイブ

VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment

投稿日: 2025年3月11日作成者: jarxiv

要約モノクラービデオから3Dシーンを効率的に再構築することは、仮想現実、ロボッ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Alligat0R: Pre-Training Through Co-Visibility Segmentation for Relative Camera Pose Regression

投稿日: 2025年3月11日作成者: jarxiv

要約トレーニング前の手法は、コンピュータービジョンを大きく進めており、Croc … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools

投稿日: 2025年3月11日作成者: jarxiv

要約世界を観察する能力は、環境と対話する方法について、推論と情報に基づいた決定 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models

投稿日: 2025年3月11日作成者: jarxiv

要約この研究では、ビジョン言語モデル（VLM）によって示される明示的および暗黙 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation

投稿日: 2025年3月11日作成者: jarxiv

要約拡散モデルは、多様な自然分布全体で高解像度の現実的な画像を生成することに顕 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Robusto-1 Dataset: Comparing Humans and VLMs on real out-of-distribution Autonomous Driving VQA from Peru

投稿日: 2025年3月11日作成者: jarxiv

要約マルチモーダルの基礎モデルが自動運転車に実験的に展開され始めると、私たちが … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning

投稿日: 2025年3月11日作成者: jarxiv

要約事前に訓練されたビジョンモデル（PVM）は、最新のロボット工学の基本ですが … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition

投稿日: 2025年3月11日作成者: jarxiv

要約海上マルチシーン認識は、特に海洋保護、環境監視、災害対応などの用途で、イン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Griffin: Aerial-Ground Cooperative Detection and Tracking Dataset and Benchmark

投稿日: 2025年3月11日作成者: jarxiv

要約大幅な進歩にもかかわらず、自律駆動システムは、単一視点センシングの固有の制 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

RS2V-L: Vehicle-Mounted LiDAR Data Generation from Roadside Sensor Observations

投稿日: 2025年3月11日作成者: jarxiv

要約洗練された制御コマンドを直接生成してマルチモーダル感覚データを処理するエン … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment

Alligat0R: Pre-Training Through Co-Visibility Segmentation for Relative Camera Pose Regression

MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools

VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models

Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation

Robusto-1 Dataset: Comparing Humans and VLMs on real out-of-distribution Autonomous Driving VQA from Peru

A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning

Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition

Griffin: Aerial-Ground Cooperative Detection and Tracking Dataset and Benchmark

RS2V-L: Vehicle-Mounted LiDAR Data Generation from Roadside Sensor Observations

最近の投稿

最近のコメント

アーカイブ

カテゴリー