cs.CV」カテゴリーアーカイブ

Implicit Priors Editing in Stable Diffusion via Targeted Token Adjustment

要約 テキストから画像への生成タスクでは、特にテキストのプロンプトに十分なコンテ … 続きを読む

カテゴリー: cs.CV | Implicit Priors Editing in Stable Diffusion via Targeted Token Adjustment はコメントを受け付けていません

Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy

要約 食道がんは、世界中で最も一般的ながんの種類の 1 つです。 従来、開腹食道 … 続きを読む

カテゴリー: cs.AI, cs.CV | Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy はコメントを受け付けていません

Skel3D: Skeleton Guided Novel View Synthesis

要約 この論文では、オブジェクトのスケルトンを利用して基礎となる拡散モデルをガイ … 続きを読む

カテゴリー: cs.CV | Skel3D: Skeleton Guided Novel View Synthesis はコメントを受け付けていません

PrefixKV: Adaptive Prefix KV Cache is What Vision Instruction-Following Models Need for Efficient Generation

要約 最近、ラージ ビジョン言語モデル (LVLM) は、多様なマルチモーダル入 … 続きを読む

カテゴリー: cs.CV | PrefixKV: Adaptive Prefix KV Cache is What Vision Instruction-Following Models Need for Efficient Generation はコメントを受け付けていません

Deep Learning for Sea Surface Temperature Reconstruction under Cloud Occlusion

要約 海面温度 (SST) は、地球の海洋と気候を理解するために非常に重要であり … 続きを読む

カテゴリー: cs.CV, I.4.5 | Deep Learning for Sea Surface Temperature Reconstruction under Cloud Occlusion はコメントを受け付けていません

Deferred Poisoning: Making the Model More Vulnerable via Hessian Singularization

要約 最近の研究では、深層学習モデルがポイズニング攻撃に対して非常に脆弱であるこ … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Deferred Poisoning: Making the Model More Vulnerable via Hessian Singularization はコメントを受け付けていません

2DGS-Room: Seed-Guided 2D Gaussian Splatting with Geometric Constrains for High-Fidelity Indoor Scene Reconstruction

要約 空間構造の固有の複雑さとテクスチャのない領域の蔓延により、屋内シーンの再構 … 続きを読む

カテゴリー: cs.CV | 2DGS-Room: Seed-Guided 2D Gaussian Splatting with Geometric Constrains for High-Fidelity Indoor Scene Reconstruction はコメントを受け付けていません

SINGER: Vivid Audio-driven Singing Video Generation with Multi-scale Spectral Diffusion Model

要約 生成モデルの最近の進歩により、話し顔ビデオの生成は大幅に強化されましたが、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD | SINGER: Vivid Audio-driven Singing Video Generation with Multi-scale Spectral Diffusion Model はコメントを受け付けていません

CleanDIFT: Diffusion Features without Noise

要約 大規模な事前トレーニング済み拡散モデルの内部特徴は、最近、幅広い下流タスク … 続きを読む

カテゴリー: cs.CV | CleanDIFT: Diffusion Features without Noise はコメントを受け付けていません

GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing

要約 データ補強は、視覚分類タスクにおける汎化を強化するために広く用いられている … 続きを読む

カテゴリー: cs.CV | GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing はコメントを受け付けていません