月別アーカイブ: 2024年5月

Understanding Retrieval-Augmented Task Adaptation for Vision-Language Models

要約 事前トレーニングされた対照的な視覚言語モデルは、幅広いタスクにわたって優れ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Understanding Retrieval-Augmented Task Adaptation for Vision-Language Models はコメントを受け付けていません

Advancing human-centric AI for robust X-ray analysis through holistic self-supervised learning

要約 AI Foundation モデルは、放射線医学などの医療分野を含むさまざ … 続きを読む

カテゴリー: cs.AI, cs.CV | Advancing human-centric AI for robust X-ray analysis through holistic self-supervised learning はコメントを受け付けていません

V-FLUTE: Visual Figurative Language Understanding with Textual Explanations

要約 大規模ビジョン言語モデル (VLM) は、視覚的な質問応答や視覚的な含意な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | V-FLUTE: Visual Figurative Language Understanding with Textual Explanations はコメントを受け付けていません

MANTIS: Interleaved Multi-Image Instruction Tuning

要約 近年、単一画像のビジョン言語タスクを効果的に解決するための、多数の大規模マ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MANTIS: Interleaved Multi-Image Instruction Tuning はコメントを受け付けていません

Compact 3D Scene Representation via Self-Organizing Gaussian Grids

要約 3D ガウス スプラッティングは、静的な 3D シーンのモデリングに非常に … 続きを読む

カテゴリー: cs.CV | Compact 3D Scene Representation via Self-Organizing Gaussian Grids はコメントを受け付けていません

Navigating Heterogeneity and Privacy in One-Shot Federated Learning with Diffusion Models

要約 フェデレーション ラーニング (FL) を使用すると、データ プライバシー … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Navigating Heterogeneity and Privacy in One-Shot Federated Learning with Diffusion Models はコメントを受け付けていません

LocInv: Localization-aware Inversion for Text-Guided Image Editing

要約 大規模な Text-to-Image (T2I) 拡散モデルは、テキスト … 続きを読む

カテゴリー: cs.CV | LocInv: Localization-aware Inversion for Text-Guided Image Editing はコメントを受け付けていません

Perception and Localization of Macular Degeneration Applying Convolutional Neural Network, ResNet and Grad-CAM

要約 罹患した患者にぼやけた視界を送るよく知られた網膜疾患は、黄斑変性症です。 … 続きを読む

カテゴリー: cs.CV, eess.IV | Perception and Localization of Macular Degeneration Applying Convolutional Neural Network, ResNet and Grad-CAM はコメントを受け付けていません

PAM-UNet: Shifting Attention on Region of Interest in Medical Images

要約 コンピュータ支援セグメンテーション手法は、医療従事者が診断結果を向上させる … 続きを読む

カテゴリー: cs.CV, eess.IV | PAM-UNet: Shifting Attention on Region of Interest in Medical Images はコメントを受け付けていません

Continual Diffusion: Continual Customization of Text-to-Image Diffusion with C-LoRA

要約 最近の研究では、いくつかの画像例を提供するだけで、テキストから画像への拡散 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Continual Diffusion: Continual Customization of Text-to-Image Diffusion with C-LoRA はコメントを受け付けていません