月別アーカイブ: 2024年7月

Dilated Strip Attention Network for Image Restoration

要約 画像の復元は、劣化した画像から潜在的な鮮明な画像を回復しようとする長年の課 … 続きを読む

カテゴリー: cs.CV, eess.IV | Dilated Strip Attention Network for Image Restoration はコメントを受け付けていません

Similarity Distance-Based Label Assignment for Tiny Object Detection

要約 小さなオブジェクトの検出は、オブジェクトのサイズが限られていて情報が不足し … 続きを読む

カテゴリー: cs.CV | Similarity Distance-Based Label Assignment for Tiny Object Detection はコメントを受け付けていません

LookupForensics: A Large-Scale Multi-Task Dataset for Multi-Phase Image-Based Fact Verification

要約 偽造画像の急増、特にディープフェイクコンテンツの津波の中で、偽造技術の継続 … 続きを読む

カテゴリー: cs.CV, cs.MM | LookupForensics: A Large-Scale Multi-Task Dataset for Multi-Phase Image-Based Fact Verification はコメントを受け付けていません

MOoSE: Multi-Orientation Sharing Experts for Open-set Scene Text Recognition

要約 新しい文字と以前に見た文字の両方に対処することを目的としたオープンセット … 続きを読む

カテゴリー: cs.CV | MOoSE: Multi-Orientation Sharing Experts for Open-set Scene Text Recognition はコメントを受け付けていません

Every Part Matters: Integrity Verification of Scientific Figures Based on Multimodal Large Language Models

要約 この論文は、科学的数値の解釈における重要な問題、つまりテキストと図のきめ細 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.DL, cs.MM | Every Part Matters: Integrity Verification of Scientific Figures Based on Multimodal Large Language Models はコメントを受け付けていません

Geometric Generative Models based on Morphological Equivariant PDEs and GANs

要約 コンテンツと画像の生成は、テクスチャ、エッジ、その他の薄い画像構造などの特 … 続きを読む

カテゴリー: cs.CV, eess.IV, math.DG | Geometric Generative Models based on Morphological Equivariant PDEs and GANs はコメントを受け付けていません

DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes

要約 ギガピクセル シナリオでの追跡には、ビデオ監視や歩行者分析において多くの潜 … 続きを読む

カテゴリー: cs.CV | DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes はコメントを受け付けていません

Model Composition for Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) の最近の開発は急速な進歩を示 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Model Composition for Multimodal Large Language Models はコメントを受け付けていません

Auto DragGAN: Editing the Generative Image Manifold in an Autoregressive Manner

要約 ピクセルレベルのきめの細かい画像編集は依然として未解決の課題です。 以前の … 続きを読む

カテゴリー: cs.CV | Auto DragGAN: Editing the Generative Image Manifold in an Autoregressive Manner はコメントを受け付けていません

Adversarial Robustification via Text-to-Image Diffusion Models

要約 敵対的堅牢性は、ニューラル ネットワークのエンコードが困難な特性であり、大 … 続きを読む

カテゴリー: cs.CV, cs.LG | Adversarial Robustification via Text-to-Image Diffusion Models はコメントを受け付けていません