月別アーカイブ: 2024年6月

Stochastic Conditional Diffusion Models for Robust Semantic Image Synthesis

要約 意味画像合成(SIS)は、意味マップ(ラベル)に対応する現実的な画像を生成 … 続きを読む

カテゴリー: cs.CV | Stochastic Conditional Diffusion Models for Robust Semantic Image Synthesis はコメントを受け付けていません

Video-LaVIT: Unified Video-Language Pre-training with Decoupled Visual-Motional Tokenization

要約 最近のマルチモーダル大規模言語モデル(LLM)の進歩に伴い、画像-テキスト … 続きを読む

カテゴリー: cs.CL, cs.CV | Video-LaVIT: Unified Video-Language Pre-training with Decoupled Visual-Motional Tokenization はコメントを受け付けていません

Scalable Wasserstein Gradient Flow for Generative Modeling through Unbalanced Optimal Transport

要約 Wasserstein Gradient Flow (WGF)は、Wass … 続きを読む

カテゴリー: cs.CV, cs.LG | Scalable Wasserstein Gradient Flow for Generative Modeling through Unbalanced Optimal Transport はコメントを受け付けていません

Portrait4D: Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data

要約 既存の一発4次元頭部合成法は、通常、3DMM再構成の助けを借りて単眼映像か … 続きを読む

カテゴリー: cs.CV | Portrait4D: Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data はコメントを受け付けていません

PLUG: Revisiting Amodal Segmentation with Foundation Model and Hierarchical Focus

要約 部分的に隠蔽された物体の完全な形状を予測することを目的としたアモーダルセグ … 続きを読む

カテゴリー: cs.CV | PLUG: Revisiting Amodal Segmentation with Foundation Model and Hierarchical Focus はコメントを受け付けていません

Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba

要約 生物システムからヒントを得たイベントカメラは、低消費電力でありながら、周囲 … 続きを読む

カテゴリー: cs.CV | Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba はコメントを受け付けていません

Automatic Cranial Defect Reconstruction with Self-Supervised Deep Deformable Masked Autoencoders

要約 毎年、何千人もの人々が頭蓋損傷に苦しんでいる。このような人々には、再建手術 … 続きを読む

カテゴリー: cs.CV, eess.IV | Automatic Cranial Defect Reconstruction with Self-Supervised Deep Deformable Masked Autoencoders はコメントを受け付けていません

DeCoF: Generated Video Detection via Frame Consistency: The First Benchmark Dataset

要約 高度な映像生成手法によって生成される映像の品質が高まるにつれ、新たなセキュ … 続きを読む

カテゴリー: cs.AI, cs.CV | DeCoF: Generated Video Detection via Frame Consistency: The First Benchmark Dataset はコメントを受け付けていません

Efficient Masked Autoencoders with Self-Consistency

要約 自然言語処理タスクにおけるマスク付き言語モデリング(MLM)に触発されたマ … 続きを読む

カテゴリー: cs.CV | Efficient Masked Autoencoders with Self-Consistency はコメントを受け付けていません

DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild

要約 画質評価(IQA)は、一連のアプリケーションにおいて、高品質な画像を選択し … 続きを読む

カテゴリー: cs.AI, cs.CV | DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild はコメントを受け付けていません