「cs.CV」カテゴリーアーカイブ

Implicit Priors Editing in Stable Diffusion via Targeted Token Adjustment

投稿日: 2024年12月5日作成者: jarxiv

要約テキストから画像への生成タスクでは、特にテキストのプロンプトに十分なコンテ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy

投稿日: 2024年12月5日作成者: jarxiv

要約食道がんは、世界中で最も一般的ながんの種類の 1 つです。従来、開腹食道 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Skel3D: Skeleton Guided Novel View Synthesis

投稿日: 2024年12月5日作成者: jarxiv

要約この論文では、オブジェクトのスケルトンを利用して基礎となる拡散モデルをガイ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PrefixKV: Adaptive Prefix KV Cache is What Vision Instruction-Following Models Need for Efficient Generation

投稿日: 2024年12月5日作成者: jarxiv

要約最近、ラージビジョン言語モデル (LVLM) は、多様なマルチモーダル入 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deep Learning for Sea Surface Temperature Reconstruction under Cloud Occlusion

投稿日: 2024年12月5日作成者: jarxiv

要約海面温度 (SST) は、地球の海洋と気候を理解するために非常に重要であり … 続きを読む →

カテゴリー: cs.CV, I.4.5 | コメントを受け付けていません

Deferred Poisoning: Making the Model More Vulnerable via Hessian Singularization

投稿日: 2024年12月5日作成者: jarxiv

要約最近の研究では、深層学習モデルがポイズニング攻撃に対して非常に脆弱であるこ … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

2DGS-Room: Seed-Guided 2D Gaussian Splatting with Geometric Constrains for High-Fidelity Indoor Scene Reconstruction

投稿日: 2024年12月5日作成者: jarxiv

要約空間構造の固有の複雑さとテクスチャのない領域の蔓延により、屋内シーンの再構 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SINGER: Vivid Audio-driven Singing Video Generation with Multi-scale Spectral Diffusion Model

投稿日: 2024年12月5日作成者: jarxiv

要約生成モデルの最近の進歩により、話し顔ビデオの生成は大幅に強化されましたが、 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD | コメントを受け付けていません

CleanDIFT: Diffusion Features without Noise

投稿日: 2024年12月5日作成者: jarxiv

要約大規模な事前トレーニング済み拡散モデルの内部特徴は、最近、幅広い下流タスク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing

投稿日: 2024年12月5日作成者: jarxiv

要約データ補強は、視覚分類タスクにおける汎化を強化するために広く用いられている … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Implicit Priors Editing in Stable Diffusion via Targeted Token Adjustment

Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy

Skel3D: Skeleton Guided Novel View Synthesis

PrefixKV: Adaptive Prefix KV Cache is What Vision Instruction-Following Models Need for Efficient Generation

Deep Learning for Sea Surface Temperature Reconstruction under Cloud Occlusion

Deferred Poisoning: Making the Model More Vulnerable via Hessian Singularization

2DGS-Room: Seed-Guided 2D Gaussian Splatting with Geometric Constrains for High-Fidelity Indoor Scene Reconstruction

SINGER: Vivid Audio-driven Singing Video Generation with Multi-scale Spectral Diffusion Model

CleanDIFT: Diffusion Features without Noise

GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing

最近の投稿

最近のコメント

アーカイブ

カテゴリー