月別アーカイブ: 2025年5月

RLMiniStyler: Light-weight RL Style Agent for Arbitrary Sequential Neural Style Generation

要約 任意のスタイル転送は、特定の芸術的画像のスタイルを別のコンテンツ画像に適用 … 続きを読む

カテゴリー: cs.CV | RLMiniStyler: Light-weight RL Style Agent for Arbitrary Sequential Neural Style Generation はコメントを受け付けていません

Illumination and Shadows in Head Rotation: experiments with Denoising Diffusion Models

要約 頭の回転中の照明と影の影響を正確にモデル化することは、画像のリアリズムを強 … 続きを読む

カテゴリー: cs.CV, I.2.10 | Illumination and Shadows in Head Rotation: experiments with Denoising Diffusion Models はコメントを受け付けていません

Deep Learning for Sea Surface Temperature Reconstruction under Cloud Occlusion

要約 雲のギャップの影響を受けた衛星画像からの海面温度(SST)の再構築は、過去 … 続きを読む

カテゴリー: cs.CV, I.4.5 | Deep Learning for Sea Surface Temperature Reconstruction under Cloud Occlusion はコメントを受け付けていません

Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks

要約 Sharpness-Aware Minimization(SAM)は、パラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IT, cs.LG, cs.NE, math.IT | Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks はコメントを受け付けていません

XrayGPT: Chest Radiographs Summarization using Medical Vision-Language Models

要約 BardやGPT-4などの大規模なビジョン言語モデルの最新のブレークスルー … 続きを読む

カテゴリー: cs.CV | XrayGPT: Chest Radiographs Summarization using Medical Vision-Language Models はコメントを受け付けていません

Learning Real Facial Concepts for Independent Deepfake Detection

要約 DeepFake検出モデルは、目標ドメインの偽物として実際のインスタンスを … 続きを読む

カテゴリー: cs.CV | Learning Real Facial Concepts for Independent Deepfake Detection はコメントを受け付けていません

Question-Answering Dense Video Events

要約 このペーパーでは、密集したビデオイベントに関する質問を提示します。これは、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Question-Answering Dense Video Events はコメントを受け付けていません

Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction

要約 Ming-Lite-Uniは、新しく設計された統一された視覚ジェネレーター … 続きを読む

カテゴリー: cs.CV | Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction はコメントを受け付けていません

CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation

要約 最近、大規模な言語モデル(LLM)が大幅に成功し、一般的なテキストを超えて … 続きを読む

カテゴリー: cs.CV | CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation はコメントを受け付けていません

Bayesian computation with generative diffusion models by Multilevel Monte Carlo

要約 生成的拡散モデルは最近、ベイジアンの逆問題で確率的サンプリングを実行する強 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.CO | Bayesian computation with generative diffusion models by Multilevel Monte Carlo はコメントを受け付けていません