cs.CV」カテゴリーアーカイブ

Controlling Language and Diffusion Models by Transporting Activations

要約 大規模な生成モデルの機能が向上し、その導入がますます広範囲に行われるように … 続きを読む

カテゴリー: 49Q22, 68T07, cs.AI, cs.CL, cs.CV, cs.LG, I.2.6 | Controlling Language and Diffusion Models by Transporting Activations はコメントを受け付けていません

MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection

要約 拡散モデルは、トレーニング データによく似た画像の生成に優れていますが、デ … 続きを読む

カテゴリー: cs.AI, cs.CV | MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection はコメントを受け付けていません

PIP-MM: Pre-Integrating Prompt Information into Visual Encoding via Existing MLLM Structures

要約 マルチモーダル大規模言語モデル (MLLM) は、視覚情報を統合することに … 続きを読む

カテゴリー: cs.CV | PIP-MM: Pre-Integrating Prompt Information into Visual Encoding via Existing MLLM Structures はコメントを受け付けていません

CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense

要約 ニューラル分類子を敵対的な攻撃から守るための継続的な取り組みにもかかわらず … 続きを読む

カテゴリー: cs.CV | CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense はコメントを受け付けていません

First Place Solution to the ECCV 2024 ROAD++ Challenge @ ROAD++ Atomic Activity Recognition 2024

要約 このレポートは、2024 ECCV ROAD++ Challenge のト … 続きを読む

カテゴリー: cs.CV | First Place Solution to the ECCV 2024 ROAD++ Challenge @ ROAD++ Atomic Activity Recognition 2024 はコメントを受け付けていません

IMITATE: Clinical Prior Guided Hierarchical Vision-Language Pre-training

要約 医療視覚言語事前トレーニング (VLP) の分野では、臨床レポートと関連す … 続きを読む

カテゴリー: cs.CV, cs.LG | IMITATE: Clinical Prior Guided Hierarchical Vision-Language Pre-training はコメントを受け付けていません

Automated Image-Based Identification and Consistent Classification of Fire Patterns with Quantitative Shape Analysis and Spatial Location Identification

要約 火災の挙動と発生源に関する洞察を提供する火災効果で構成される火災パターンは … 続きを読む

カテゴリー: cs.CV, cs.HC | Automated Image-Based Identification and Consistent Classification of Fire Patterns with Quantitative Shape Analysis and Spatial Location Identification はコメントを受け付けていません

WaveMixSR-V2: Enhancing Super-resolution with Higher Efficiency

要約 単一画像の超解像度における最近の進歩は、主にトークン ミキサーとトランスフ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, I.2.10 | WaveMixSR-V2: Enhancing Super-resolution with Higher Efficiency はコメントを受け付けていません

Detection of Micromobility Vehicles in Urban Traffic Videos

要約 都市の交通環境では、特に電動スクーターや自転車などの超小型モビリティ車両の … 続きを読む

カテゴリー: cs.CV | Detection of Micromobility Vehicles in Urban Traffic Videos はコメントを受け付けていません

Decoupling Semantic Similarity from Spatial Alignment for Neural Networks

要約 ディープ ニューラル ネットワークはどのような表現を学習しますか? ニュー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Decoupling Semantic Similarity from Spatial Alignment for Neural Networks はコメントを受け付けていません