月別アーカイブ: 2025年3月

Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes

投稿日: 2025年3月26日作成者: jarxiv

要約 3D屋内シーンの生成は、デジタルおよび現実世界の環境の設計にとって重要な問 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush

投稿日: 2025年3月26日作成者: jarxiv

要約ビデオゲームの複雑さが着実に増加するにつれて、ゲームコンテンツの自動生成が … 続きを読む →

カテゴリー: cs.CV, I.4 | コメントを受け付けていません

SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model

投稿日: 2025年3月26日作成者: jarxiv

要約ビジョン言語モデル（VLM）の出現により、マルチモーダル情報の理解において … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

PAVE: Patching and Adapting Video Large Language Models

投稿日: 2025年3月26日作成者: jarxiv

要約事前に訓練されたビデオ大規模な言語モデル（ビデオLLM）は、驚くべき推論機 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors

投稿日: 2025年3月26日作成者: jarxiv

要約ニューラル放射輝度（NERF）は、主に過剰適合と長いトレーニング時間のため … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models

投稿日: 2025年3月26日作成者: jarxiv

要約合成開口レーダー（SAR）画像は、全天候型、終日、高解像度のイメージング機 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation

投稿日: 2025年3月26日作成者: jarxiv

要約テキストからイメージまでの拡散モデルは、テキスト入力に基づいて現実的な画像 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SeLIP: Similarity Enhanced Contrastive Language Image Pretraining for Multi-modal Head MRI

投稿日: 2025年3月26日作成者: jarxiv

要約その深い学習（DL）の方法は多くの医療画像分析タスクで大きな可能性を示して … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SpectroMotion: Dynamic 3D Reconstruction of Specular Scenes

投稿日: 2025年3月26日作成者: jarxiv

要約 3Dガウススプラッティング（3DG）と物理ベースのレンダリング（PBR）お … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LENVIZ: A High-Resolution Low-Exposure Night Vision Benchmark Dataset

投稿日: 2025年3月26日作成者: jarxiv

要約低光の画像強化は、暗視や監視から自律運転まで、無数の用途にとって非常に重要 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年3月

Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes

In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush

SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model

PAVE: Patching and Adapting Video Large Language Models

FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors

Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models

EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation

SeLIP: Similarity Enhanced Contrastive Language Image Pretraining for Multi-modal Head MRI

SpectroMotion: Dynamic 3D Reconstruction of Specular Scenes

LENVIZ: A High-Resolution Low-Exposure Night Vision Benchmark Dataset

最近の投稿

最近のコメント

アーカイブ

カテゴリー