月別アーカイブ: 2025年2月

Personalized Image Generation with Deep Generative Models: A Decade Survey

投稿日: 2025年2月19日作成者: jarxiv

要約生成モデルの最近の進歩により、パーソナライズされたコンテンツ作成の開発が大 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Scene Aware Person Image Generation through Global Contextual Conditioning

投稿日: 2025年2月19日作成者: jarxiv

要約人のイメージ生成は、興味をそそるが挑戦的な問題です。ただし、制約された状 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling

投稿日: 2025年2月19日作成者: jarxiv

要約この論文では、ユーザーの指示に従って画像が合成される条件付き画像生成のタス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Semantically Consistent Person Image Generation

投稿日: 2025年2月19日作成者: jarxiv

要約コンテキストを認識している人の画像生成のためのデータ駆動型アプローチを提案 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Understanding and Rectifying Safety Perception Distortion in VLMs

投稿日: 2025年2月19日作成者: jarxiv

要約最近の研究では、ビジョンモデル（VLM）がビジョンモダリティを統合した後、 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

WeedsGalore: A Multispectral and Multitemporal UAV-based Dataset for Crop and Weed Segmentation in Agricultural Maize Fields

投稿日: 2025年2月19日作成者: jarxiv

要約雑草は、収穫量の損失の主な理由の1つですが、現在の除草習慣は効率的かつ標的 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

STAR: Scale-wise Text-conditioned AutoRegressive image generation

投稿日: 2025年2月19日作成者: jarxiv

要約スケールごとの自動回帰パラダイムを使用するテキストから画像モデルであるSt … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Is Noise Conditioning Necessary for Denoising Generative Models?

投稿日: 2025年2月19日作成者: jarxiv

要約ノイズコンディショニングは、拡散モデルを除去するには不可欠であると広く信じ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Magma: A Foundation Model for Multimodal AI Agents

投稿日: 2025年2月19日作成者: jarxiv

要約マグマは、デジタルワールドと物理世界の両方でマルチモーダルAIエージェント … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG, cs.RO | コメントを受け付けていません

AV-Flow: Transforming Text to Audio-Visual Human-like Interactions

投稿日: 2025年2月19日作成者: jarxiv

要約テキスト入力のみが与えられた写真と現実的な4Dトーキングアバターをアニメー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年2月

Personalized Image Generation with Deep Generative Models: A Decade Survey

Scene Aware Person Image Generation through Global Contextual Conditioning

Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling

Semantically Consistent Person Image Generation

Understanding and Rectifying Safety Perception Distortion in VLMs

WeedsGalore: A Multispectral and Multitemporal UAV-based Dataset for Crop and Weed Segmentation in Agricultural Maize Fields

STAR: Scale-wise Text-conditioned AutoRegressive image generation

Is Noise Conditioning Necessary for Denoising Generative Models?

Magma: A Foundation Model for Multimodal AI Agents

AV-Flow: Transforming Text to Audio-Visual Human-like Interactions

最近の投稿

最近のコメント

アーカイブ

カテゴリー