「cs.CV」カテゴリーアーカイブ

Fine-Grained Erasure in Text-to-Image Diffusion-based Foundation Models

投稿日: 2025年3月26日作成者: jarxiv

要約テキストから画像への生成モデルにおける既存の未学習アルゴリズムは、特定のタ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DeNVeR: Deformable Neural Vessel Representations for Unsupervised Video Vessel Segmentation

投稿日: 2025年3月26日作成者: jarxiv

要約この論文では、注釈付きの地上真実のないX線血管造影ビデオの容器セグメンテー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SITA: Structurally Imperceptible and Transferable Adversarial Attacks for Stylized Image Generation

投稿日: 2025年3月26日作成者: jarxiv

要約画像生成テクノロジーは、さまざまな分野で大きな進歩をもたらしましたが、特に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes

投稿日: 2025年3月26日作成者: jarxiv

要約 3D屋内シーンの生成は、デジタルおよび現実世界の環境の設計にとって重要な問 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush

投稿日: 2025年3月26日作成者: jarxiv

要約ビデオゲームの複雑さが着実に増加するにつれて、ゲームコンテンツの自動生成が … 続きを読む →

カテゴリー: cs.CV, I.4 | コメントを受け付けていません

SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model

投稿日: 2025年3月26日作成者: jarxiv

要約ビジョン言語モデル（VLM）の出現により、マルチモーダル情報の理解において … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

PAVE: Patching and Adapting Video Large Language Models

投稿日: 2025年3月26日作成者: jarxiv

要約事前に訓練されたビデオ大規模な言語モデル（ビデオLLM）は、驚くべき推論機 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors

投稿日: 2025年3月26日作成者: jarxiv

要約ニューラル放射輝度（NERF）は、主に過剰適合と長いトレーニング時間のため … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models

投稿日: 2025年3月26日作成者: jarxiv

要約合成開口レーダー（SAR）画像は、全天候型、終日、高解像度のイメージング機 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation

投稿日: 2025年3月26日作成者: jarxiv

要約テキストからイメージまでの拡散モデルは、テキスト入力に基づいて現実的な画像 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Fine-Grained Erasure in Text-to-Image Diffusion-based Foundation Models

DeNVeR: Deformable Neural Vessel Representations for Unsupervised Video Vessel Segmentation

SITA: Structurally Imperceptible and Transferable Adversarial Attacks for Stylized Image Generation

Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes

In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush

SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model

PAVE: Patching and Adapting Video Large Language Models

FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors

Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models

EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー