cs.CV」カテゴリーアーカイブ

VerA: Versatile Anonymization Applicable to Clinical Facial Photographs

要約 顔画像の配布におけるプライバシーの要求は、GDPR、DPDPA、CCPA、 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | VerA: Versatile Anonymization Applicable to Clinical Facial Photographs はコメントを受け付けていません

FocusLLaVA: A Coarse-to-Fine Approach for Efficient and Effective Visual Token Compression

要約 マルチモーダル大規模言語モデルの最近の進歩により、高解像度の画像入力がモデ … 続きを読む

カテゴリー: cs.CV | FocusLLaVA: A Coarse-to-Fine Approach for Efficient and Effective Visual Token Compression はコメントを受け付けていません

AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection

要約 物体検出は多くの安全性が重要なアプリケーションに不可欠なものとなるため、そ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection はコメントを受け付けていません

CP-UNet: Contour-based Probabilistic Model for Medical Ultrasound Images Segmentation

要約 深層学習ベースのセグメンテーション手法は、超音波画像内の病変を検出するため … 続きを読む

カテゴリー: cs.CV, eess.IV | CP-UNet: Contour-based Probabilistic Model for Medical Ultrasound Images Segmentation はコメントを受け付けていません

High-performance real-world optical computing trained by in situ gradient-based model-free optimization

要約 光コンピューティング システムは高速かつ低エネルギーのデータ処理を提供しま … 続きを読む

カテゴリー: cs.CV, cs.ET, cs.LG, physics.optics | High-performance real-world optical computing trained by in situ gradient-based model-free optimization はコメントを受け付けていません

VG-SSL: Benchmarking Self-supervised Representation Learning Approaches for Visual Geo-localization

要約 視覚的地理位置特定 (VG) は、特にロボットや車両の自律ナビゲーションに … 続きを読む

カテゴリー: cs.CV | VG-SSL: Benchmarking Self-supervised Representation Learning Approaches for Visual Geo-localization はコメントを受け付けていません

Guided MRI Reconstruction via Schrödinger Bridge

要約 磁気共鳴画像法 (MRI) は、異なるコントラスト画像が同様の構造情報を共 … 続きを読む

カテゴリー: cs.CV, eess.IV, eess.SP | Guided MRI Reconstruction via Schrödinger Bridge はコメントを受け付けていません

Dual Attention Model with Reinforcement Learning for Classification of Histology Whole-Slide Images

要約 デジタル全体スライド画像 (WSI) は通常、顕微鏡解像度でキャプチャされ … 続きを読む

カテゴリー: cs.CV, eess.IV | Dual Attention Model with Reinforcement Learning for Classification of Histology Whole-Slide Images はコメントを受け付けていません

Looking Beyond Text: Reducing Language bias in Large Vision-Language Models via Multimodal Dual-Attention and Soft-Image Guidance

要約 大規模ビジョン言語モデル (LVLM) は、さまざまなビジョン言語タスクで … 続きを読む

カテゴリー: cs.CL, cs.CV | Looking Beyond Text: Reducing Language bias in Large Vision-Language Models via Multimodal Dual-Attention and Soft-Image Guidance はコメントを受け付けていません

EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild

要約 私たちの研究は、単一視点の画像から手とオブジェクトのインタラクションを再構 … 続きを読む

カテゴリー: cs.CV | EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild はコメントを受け付けていません