「cs.CV」カテゴリーアーカイブ

Avoid Wasted Annotation Costs in Open-set Active Learning with Pre-trained Vision-Language Model

投稿日: 2024年8月12日作成者: jarxiv

要約アクティブラーニング (AL) は、情報量の高いデータを選択的に収集する … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios

投稿日: 2024年8月12日作成者: jarxiv

要約無人航空機 (UAV) は捜索救助 (SAR) 業務に革命をもたらしました … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI

投稿日: 2024年8月12日作成者: jarxiv

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation

投稿日: 2024年8月12日作成者: jarxiv

要約 3D 再構成は、移動ロボットの自律ナビゲーション分野で広く使用されています … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

UVMap-ID: A Controllable and Personalized UV Map Generative Model

投稿日: 2024年8月12日作成者: jarxiv

要約最近、拡散モデルは、提供されたテキストプロンプトに基づいてリアルな 2D … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning

投稿日: 2024年8月12日作成者: jarxiv

要約ドメインシフトにより、ディープラーニング画像分類器は、トレーニングとは … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, I.2 | コメントを受け付けていません

Pair then Relation: Pair-Net for Panoptic Scene Graph Generation

投稿日: 2024年8月12日作成者: jarxiv

要約パノプティックシーングラフ (PSG) は、ボックスの代わりにパノプテ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Model Debiasing by Learnable Data Augmentation

投稿日: 2024年8月12日作成者: jarxiv

要約ディープニューラルネットワークは、トレーニングデータを効率的にフィッ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description

投稿日: 2024年8月12日作成者: jarxiv

要約 Visual Spatial description (VSD) は、画像 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery

投稿日: 2024年8月12日作成者: jarxiv

要約 Medical Visual Question Answering (VQ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Avoid Wasted Annotation Costs in Open-set Active Learning with Pre-trained Vision-Language Model

UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios

GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI

OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation

UVMap-ID: A Controllable and Personalized UV Map Generative Model

CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning

Pair then Relation: Pair-Net for Panoptic Scene Graph Generation

Model Debiasing by Learnable Data Augmentation

LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description

Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery

最近の投稿

最近のコメント

アーカイブ

カテゴリー