cs.CV」カテゴリーアーカイブ

MCL: Multi-view Enhanced Contrastive Learning for Chest X-ray Report Generation

要約 放射線科レポートは、治療戦略を計画し、医師と患者のコミュニケーションを強化 … 続きを読む

カテゴリー: cs.AI, cs.CV | MCL: Multi-view Enhanced Contrastive Learning for Chest X-ray Report Generation はコメントを受け付けていません

A Low-Resolution Image is Worth 1×1 Words: Enabling Fine Image Super-Resolution with Transformers and TaylorShift

要約 トランスベースの超解像度 (SR) モデルは、最近画像再構成の品質を向上さ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | A Low-Resolution Image is Worth 1×1 Words: Enabling Fine Image Super-Resolution with Transformers and TaylorShift はコメントを受け付けていません

ColorEdit: Training-free Image-Guided Color editing with diffusion model

要約 Text-to-image (T2I) 拡散モデルは、優れた生成機能を備え … 続きを読む

カテゴリー: cs.AI, cs.CV | ColorEdit: Training-free Image-Guided Color editing with diffusion model はコメントを受け付けていません

ScribbleVS: Scribble-Supervised Medical Image Segmentation via Dynamic Competitive Pseudo Label Selection

要約 臨床医学では、正確な画像セグメンテーションは臨床医に実質的なサポートを提供 … 続きを読む

カテゴリー: cs.CV | ScribbleVS: Scribble-Supervised Medical Image Segmentation via Dynamic Competitive Pseudo Label Selection はコメントを受け付けていません

DCD: Discriminative and Consistent Representation Distillation

要約 知識蒸留 (KD) は、大規模な教師モデルから小規模な生徒モデルに知識を伝 … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, I.2 | DCD: Discriminative and Consistent Representation Distillation はコメントを受け付けていません

Morpho-Aware Global Attention for Image Matting

要約 ビジョン トランスフォーマー (ViT) と畳み込みニューラル ネットワー … 続きを読む

カテゴリー: cs.CV | Morpho-Aware Global Attention for Image Matting はコメントを受け付けていません

Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning

要約 マルチモーダル大規模言語モデル (MLLM) は、画像内の記述タスクには優 … 続きを読む

カテゴリー: cs.CV | Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning はコメントを受け付けていません

The Unreasonable Effectiveness of Guidance for Diffusion Models

要約 ガイダンスは、拡散モデルによって生成された画像の知覚品質を向上させるために … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | The Unreasonable Effectiveness of Guidance for Diffusion Models はコメントを受け付けていません

Partial Scene Text Retrieval

要約 部分シーン テキスト取得のタスクには、画像ギャラリーからの特定のクエリ テ … 続きを読む

カテゴリー: cs.CV | Partial Scene Text Retrieval はコメントを受け付けていません

CLCE: An Approach to Refining Cross-Entropy and Contrastive Learning for Optimized Learning Fusion

要約 最先端の事前トレーニング済み画像モデルは、主に 2 段階のアプローチを採用 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CLCE: An Approach to Refining Cross-Entropy and Contrastive Learning for Optimized Learning Fusion はコメントを受け付けていません