cs.CV」カテゴリーアーカイブ

Fine-Grained Erasure in Text-to-Image Diffusion-based Foundation Models

要約 テキストから画像への生成モデルにおける既存の未学習アルゴリズムは、特定のタ … 続きを読む

カテゴリー: cs.CV | Fine-Grained Erasure in Text-to-Image Diffusion-based Foundation Models はコメントを受け付けていません

DeNVeR: Deformable Neural Vessel Representations for Unsupervised Video Vessel Segmentation

要約 この論文では、注釈付きの地上真実のないX線血管造影ビデオの容器セグメンテー … 続きを読む

カテゴリー: cs.CV | DeNVeR: Deformable Neural Vessel Representations for Unsupervised Video Vessel Segmentation はコメントを受け付けていません

SITA: Structurally Imperceptible and Transferable Adversarial Attacks for Stylized Image Generation

要約 画像生成テクノロジーは、さまざまな分野で大きな進歩をもたらしましたが、特に … 続きを読む

カテゴリー: cs.CV | SITA: Structurally Imperceptible and Transferable Adversarial Attacks for Stylized Image Generation はコメントを受け付けていません

Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes

要約 3D屋内シーンの生成は、デジタルおよび現実世界の環境の設計にとって重要な問 … 続きを読む

カテゴリー: cs.CV | Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes はコメントを受け付けていません

In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush

要約 ビデオゲームの複雑さが着実に増加するにつれて、ゲームコンテンツの自動生成が … 続きを読む

カテゴリー: cs.CV, I.4 | In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush はコメントを受け付けていません

SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model

要約 ビジョン言語モデル(VLM)の出現により、マルチモーダル情報の理解において … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model はコメントを受け付けていません

PAVE: Patching and Adapting Video Large Language Models

要約 事前に訓練されたビデオ大規模な言語モデル(ビデオLLM)は、驚くべき推論機 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PAVE: Patching and Adapting Video Large Language Models はコメントを受け付けていません

FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors

要約 ニューラル放射輝度(NERF)は、主に過剰適合と長いトレーニング時間のため … 続きを読む

カテゴリー: cs.CV | FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors はコメントを受け付けていません

Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models

要約 合成開口レーダー(SAR)画像は、全天候型、終日、高解像度のイメージング機 … 続きを読む

カテゴリー: cs.CV, eess.IV | Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models はコメントを受け付けていません

EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation

要約 テキストからイメージまでの拡散モデルは、テキスト入力に基づいて現実的な画像 … 続きを読む

カテゴリー: cs.CV | EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation はコメントを受け付けていません