月別アーカイブ: 2024年7月

Dilated Strip Attention Network for Image Restoration

投稿日: 2024年7月29日作成者: jarxiv

要約画像の復元は、劣化した画像から潜在的な鮮明な画像を回復しようとする長年の課 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Similarity Distance-Based Label Assignment for Tiny Object Detection

投稿日: 2024年7月29日作成者: jarxiv

要約小さなオブジェクトの検出は、オブジェクトのサイズが限られていて情報が不足し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LookupForensics: A Large-Scale Multi-Task Dataset for Multi-Phase Image-Based Fact Verification

投稿日: 2024年7月29日作成者: jarxiv

要約偽造画像の急増、特にディープフェイクコンテンツの津波の中で、偽造技術の継続 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

MOoSE: Multi-Orientation Sharing Experts for Open-set Scene Text Recognition

投稿日: 2024年7月29日作成者: jarxiv

要約新しい文字と以前に見た文字の両方に対処することを目的としたオープンセット … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Every Part Matters: Integrity Verification of Scientific Figures Based on Multimodal Large Language Models

投稿日: 2024年7月29日作成者: jarxiv

要約この論文は、科学的数値の解釈における重要な問題、つまりテキストと図のきめ細 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.DL, cs.MM | コメントを受け付けていません

Geometric Generative Models based on Morphological Equivariant PDEs and GANs

投稿日: 2024年7月29日作成者: jarxiv

要約コンテンツと画像の生成は、テクスチャ、エッジ、その他の薄い画像構造などの特 … 続きを読む →

カテゴリー: cs.CV, eess.IV, math.DG | コメントを受け付けていません

DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes

投稿日: 2024年7月29日作成者: jarxiv

要約ギガピクセルシナリオでの追跡には、ビデオ監視や歩行者分析において多くの潜 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Model Composition for Multimodal Large Language Models

投稿日: 2024年7月29日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の最近の開発は急速な進歩を示 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Auto DragGAN: Editing the Generative Image Manifold in an Autoregressive Manner

投稿日: 2024年7月29日作成者: jarxiv

要約ピクセルレベルのきめの細かい画像編集は依然として未解決の課題です。以前の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Adversarial Robustification via Text-to-Image Diffusion Models

投稿日: 2024年7月29日作成者: jarxiv

要約敵対的堅牢性は、ニューラルネットワークのエンコードが困難な特性であり、大 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年7月

Dilated Strip Attention Network for Image Restoration

Similarity Distance-Based Label Assignment for Tiny Object Detection

LookupForensics: A Large-Scale Multi-Task Dataset for Multi-Phase Image-Based Fact Verification

MOoSE: Multi-Orientation Sharing Experts for Open-set Scene Text Recognition

Every Part Matters: Integrity Verification of Scientific Figures Based on Multimodal Large Language Models

Geometric Generative Models based on Morphological Equivariant PDEs and GANs

DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes

Model Composition for Multimodal Large Language Models

Auto DragGAN: Editing the Generative Image Manifold in an Autoregressive Manner

Adversarial Robustification via Text-to-Image Diffusion Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー