投稿者「jarxiv」のアーカイブ

Semi-Automated Quality Assurance in Digital Pathology: Tile Classification Approach

要約 品質保証は、マイナーなアーティファクトでさえ大きな効果をもたらす可能性のあ … 続きを読む

カテゴリー: cs.CV, eess.IV | Semi-Automated Quality Assurance in Digital Pathology: Tile Classification Approach はコメントを受け付けていません

Visually Descriptive Language Model for Vector Graphics Reasoning

要約 大きな進歩にもかかわらず、大規模なマルチモーダルモデル(LMM)は、形状、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Visually Descriptive Language Model for Vector Graphics Reasoning はコメントを受け付けていません

VINCIE: Unlocking In-context Image Editing from Video

要約 コンテキスト内画像編集は、テキストと以前に生成された画像を含むコンテキスト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | VINCIE: Unlocking In-context Image Editing from Video はコメントを受け付けていません

CAT: A Conditional Adaptation Tailor for Efficient and Effective Instance-Specific Pansharpening on Real-World Data

要約 Pansharpeningは、高解像度のパンクロマティック(PAN)画像と … 続きを読む

カテゴリー: cs.CV | CAT: A Conditional Adaptation Tailor for Efficient and Effective Instance-Specific Pansharpening on Real-World Data はコメントを受け付けていません

ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems

要約 逆の問題を解決するための情報に基づいたデータ事前に、より一般的には報酬モデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems はコメントを受け付けていません

SpectralAR: Spectral Autoregressive Visual Generation

要約 自己回帰視覚生成は、拡散モデルと比較して、そのスケーラビリティと他のモダリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SpectralAR: Spectral Autoregressive Visual Generation はコメントを受け付けていません

MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning

要約 このホワイトペーパーでは、画像生成モデルの推論能力を調査するために、大規模 … 続きを読む

カテゴリー: cs.CL, cs.CV | MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning はコメントを受け付けていません

Beyond Attention or Similarity: Maximizing Conditional Diversity for Token Pruning in MLLMs

要約 マルチモーダルの大手言語モデル(MLLMS)では、入力視覚トークンの長さは … 続きを読む

カテゴリー: cs.AI, cs.CV | Beyond Attention or Similarity: Maximizing Conditional Diversity for Token Pruning in MLLMs はコメントを受け付けていません

Eye, Robot: Learning to Look to Act with a BC-RL Perception-Action Loop

要約 人間は視覚的な世界を受動的に観察しません – 私たちは行動する … 続きを読む

カテゴリー: cs.CV, cs.RO | Eye, Robot: Learning to Look to Act with a BC-RL Perception-Action Loop はコメントを受け付けていません

GenWorld: Towards Detecting AI-generated Real-world Simulation Videos

要約 ビデオ生成テクノロジーの繁栄は、実際の情報の信頼性を危険にさらし、AIに生 … 続きを読む

カテゴリー: cs.CV | GenWorld: Towards Detecting AI-generated Real-world Simulation Videos はコメントを受け付けていません