月別アーカイブ: 2025年3月

Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes

要約 3D屋内シーンの生成は、デジタルおよび現実世界の環境の設計にとって重要な問 … 続きを読む

カテゴリー: cs.CV | Decorum: A Language-Based Approach For Style-Conditioned Synthesis of Indoor 3D Scenes はコメントを受け付けていません

In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush

要約 ビデオゲームの複雑さが着実に増加するにつれて、ゲームコンテンツの自動生成が … 続きを読む

カテゴリー: cs.CV, I.4 | In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush はコメントを受け付けていません

SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model

要約 ビジョン言語モデル(VLM)の出現により、マルチモーダル情報の理解において … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model はコメントを受け付けていません

PAVE: Patching and Adapting Video Large Language Models

要約 事前に訓練されたビデオ大規模な言語モデル(ビデオLLM)は、驚くべき推論機 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PAVE: Patching and Adapting Video Large Language Models はコメントを受け付けていません

FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors

要約 ニューラル放射輝度(NERF)は、主に過剰適合と長いトレーニング時間のため … 続きを読む

カテゴリー: cs.CV | FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors はコメントを受け付けていません

Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models

要約 合成開口レーダー(SAR)画像は、全天候型、終日、高解像度のイメージング機 … 続きを読む

カテゴリー: cs.CV, eess.IV | Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models はコメントを受け付けていません

EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation

要約 テキストからイメージまでの拡散モデルは、テキスト入力に基づいて現実的な画像 … 続きを読む

カテゴリー: cs.CV | EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation はコメントを受け付けていません

SeLIP: Similarity Enhanced Contrastive Language Image Pretraining for Multi-modal Head MRI

要約 その深い学習(DL)の方法は多くの医療画像分析タスクで大きな可能性を示して … 続きを読む

カテゴリー: cs.AI, cs.CV | SeLIP: Similarity Enhanced Contrastive Language Image Pretraining for Multi-modal Head MRI はコメントを受け付けていません

SpectroMotion: Dynamic 3D Reconstruction of Specular Scenes

要約 3Dガウススプラッティング(3DG)と物理ベースのレンダリング(PBR)お … 続きを読む

カテゴリー: cs.CV | SpectroMotion: Dynamic 3D Reconstruction of Specular Scenes はコメントを受け付けていません

LENVIZ: A High-Resolution Low-Exposure Night Vision Benchmark Dataset

要約 低光の画像強化は、暗視や監視から自律運転まで、無数の用途にとって非常に重要 … 続きを読む

カテゴリー: cs.AI, cs.CV | LENVIZ: A High-Resolution Low-Exposure Night Vision Benchmark Dataset はコメントを受け付けていません