「cs.CV」カテゴリーアーカイブ

Controlling Language and Diffusion Models by Transporting Activations

投稿日: 2024年10月31日作成者: jarxiv

要約大規模な生成モデルの機能が向上し、その導入がますます広範囲に行われるように … 続きを読む →

カテゴリー: 49Q22, 68T07, cs.AI, cs.CL, cs.CV, cs.LG, I.2.6 | コメントを受け付けていません

MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection

投稿日: 2024年10月31日作成者: jarxiv

要約拡散モデルは、トレーニングデータによく似た画像の生成に優れていますが、デ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

PIP-MM: Pre-Integrating Prompt Information into Visual Encoding via Existing MLLM Structures

投稿日: 2024年10月31日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、視覚情報を統合することに … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense

投稿日: 2024年10月31日作成者: jarxiv

要約ニューラル分類子を敵対的な攻撃から守るための継続的な取り組みにもかかわらず … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

First Place Solution to the ECCV 2024 ROAD++ Challenge @ ROAD++ Atomic Activity Recognition 2024

投稿日: 2024年10月31日作成者: jarxiv

要約このレポートは、2024 ECCV ROAD++ Challenge のト … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

IMITATE: Clinical Prior Guided Hierarchical Vision-Language Pre-training

投稿日: 2024年10月31日作成者: jarxiv

要約医療視覚言語事前トレーニング (VLP) の分野では、臨床レポートと関連す … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Automated Image-Based Identification and Consistent Classification of Fire Patterns with Quantitative Shape Analysis and Spatial Location Identification

投稿日: 2024年10月31日作成者: jarxiv

要約火災の挙動と発生源に関する洞察を提供する火災効果で構成される火災パターンは … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

WaveMixSR-V2: Enhancing Super-resolution with Higher Efficiency

投稿日: 2024年10月31日作成者: jarxiv

要約単一画像の超解像度における最近の進歩は、主にトークンミキサーとトランスフ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, I.2.10 | コメントを受け付けていません

Detection of Micromobility Vehicles in Urban Traffic Videos

投稿日: 2024年10月31日作成者: jarxiv

要約都市の交通環境では、特に電動スクーターや自転車などの超小型モビリティ車両の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Decoupling Semantic Similarity from Spatial Alignment for Neural Networks

投稿日: 2024年10月31日作成者: jarxiv

要約ディープニューラルネットワークはどのような表現を学習しますか? ニュー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Controlling Language and Diffusion Models by Transporting Activations

MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection

PIP-MM: Pre-Integrating Prompt Information into Visual Encoding via Existing MLLM Structures

CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense

First Place Solution to the ECCV 2024 ROAD++ Challenge @ ROAD++ Atomic Activity Recognition 2024

IMITATE: Clinical Prior Guided Hierarchical Vision-Language Pre-training

Automated Image-Based Identification and Consistent Classification of Fire Patterns with Quantitative Shape Analysis and Spatial Location Identification

WaveMixSR-V2: Enhancing Super-resolution with Higher Efficiency

Detection of Micromobility Vehicles in Urban Traffic Videos

Decoupling Semantic Similarity from Spatial Alignment for Neural Networks

最近の投稿

最近のコメント

アーカイブ

カテゴリー