月別アーカイブ: 2024年8月

UVMap-ID: A Controllable and Personalized UV Map Generative Model

要約 最近、拡散モデルは、提供されたテキスト プロンプトに基づいてリアルな 2D … 続きを読む

カテゴリー: cs.CV | UVMap-ID: A Controllable and Personalized UV Map Generative Model はコメントを受け付けていません

CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning

要約 ドメイン シフトにより、ディープ ラーニング画像分類器は、トレーニングとは … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, I.2 | CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning はコメントを受け付けていません

Pair then Relation: Pair-Net for Panoptic Scene Graph Generation

要約 パノプティック シーン グラフ (PSG) は、ボックスの代わりにパノプテ … 続きを読む

カテゴリー: cs.AI, cs.CV | Pair then Relation: Pair-Net for Panoptic Scene Graph Generation はコメントを受け付けていません

Model Debiasing by Learnable Data Augmentation

要約 ディープ ニューラル ネットワークは、トレーニング データを効率的にフィッ … 続きを読む

カテゴリー: cs.CV, cs.LG | Model Debiasing by Learnable Data Augmentation はコメントを受け付けていません

LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description

要約 Visual Spatial description (VSD) は、画像 … 続きを読む

カテゴリー: cs.AI, cs.CV | LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description はコメントを受け付けていません

Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery

要約 Medical Visual Question Answering (VQ … 続きを読む

カテゴリー: cs.CV, cs.RO | Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery はコメントを受け付けていません

Efficient Multimodal Large Language Models: A Survey

要約 過去 1 年間、マルチモーダル大規模言語モデル (MLLM) は、視覚的な … 続きを読む

カテゴリー: cs.AI, cs.CV | Efficient Multimodal Large Language Models: A Survey はコメントを受け付けていません

In Defense of Lazy Visual Grounding for Open-Vocabulary Semantic Segmentation

要約 我々は、オープンボキャブラリーのセマンティックセグメンテーションのために、 … 続きを読む

カテゴリー: cs.CV | In Defense of Lazy Visual Grounding for Open-Vocabulary Semantic Segmentation はコメントを受け付けていません

DAFT-GAN: Dual Affine Transformation Generative Adversarial Network for Text-Guided Image Inpainting

要約 近年、テキストガイドによる画像修復に関連する研究に大きな焦点が当てられてい … 続きを読む

カテゴリー: cs.CV | DAFT-GAN: Dual Affine Transformation Generative Adversarial Network for Text-Guided Image Inpainting はコメントを受け付けていません

ASDF: Assembly State Detection Utilizing Late Fusion by Integrating 6D Pose Estimation

要約 医療および産業分野では、効率と安全性を確保するために、組み立てプロセスのガ … 続きを読む

カテゴリー: cs.CV, cs.RO | ASDF: Assembly State Detection Utilizing Late Fusion by Integrating 6D Pose Estimation はコメントを受け付けていません