cs.CV」カテゴリーアーカイブ

Avoid Wasted Annotation Costs in Open-set Active Learning with Pre-trained Vision-Language Model

要約 アクティブ ラーニング (AL) は、情報量の高いデータを選択的に収集する … 続きを読む

カテゴリー: cs.AI, cs.CV | Avoid Wasted Annotation Costs in Open-set Active Learning with Pre-trained Vision-Language Model はコメントを受け付けていません

UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios

要約 無人航空機 (UAV) は捜索救助 (SAR) 業務に革命をもたらしました … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios はコメントを受け付けていません

GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.CV, eess.IV | GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI はコメントを受け付けていません

OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation

要約 3D 再構成は、移動ロボットの自律ナビゲーション分野で広く使用されています … 続きを読む

カテゴリー: cs.CV, cs.RO | OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation はコメントを受け付けていません

UVMap-ID: A Controllable and Personalized UV Map Generative Model

要約 最近、拡散モデルは、提供されたテキスト プロンプトに基づいてリアルな 2D … 続きを読む

カテゴリー: cs.CV | UVMap-ID: A Controllable and Personalized UV Map Generative Model はコメントを受け付けていません

CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning

要約 ドメイン シフトにより、ディープ ラーニング画像分類器は、トレーニングとは … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, I.2 | CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning はコメントを受け付けていません

Pair then Relation: Pair-Net for Panoptic Scene Graph Generation

要約 パノプティック シーン グラフ (PSG) は、ボックスの代わりにパノプテ … 続きを読む

カテゴリー: cs.AI, cs.CV | Pair then Relation: Pair-Net for Panoptic Scene Graph Generation はコメントを受け付けていません

Model Debiasing by Learnable Data Augmentation

要約 ディープ ニューラル ネットワークは、トレーニング データを効率的にフィッ … 続きを読む

カテゴリー: cs.CV, cs.LG | Model Debiasing by Learnable Data Augmentation はコメントを受け付けていません

LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description

要約 Visual Spatial description (VSD) は、画像 … 続きを読む

カテゴリー: cs.AI, cs.CV | LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description はコメントを受け付けていません

Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery

要約 Medical Visual Question Answering (VQ … 続きを読む

カテゴリー: cs.CV, cs.RO | Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery はコメントを受け付けていません