cs.CV」カテゴリーアーカイブ

D-MiSo: Editing Dynamic 3D Scenes using Multi-Gaussians Soup

要約 過去数年間、我々はガウススプラッティング(Gaussian Splatti … 続きを読む

カテゴリー: cs.CV | D-MiSo: Editing Dynamic 3D Scenes using Multi-Gaussians Soup はコメントを受け付けていません

Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

要約 本研究では、テキストから画像への変換のためのスケールワイズ変換器であるSw … 続きを読む

カテゴリー: cs.CV | Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis はコメントを受け付けていません

Diffusion Models with Anisotropic Gaussian Splatting for Image Inpainting

要約 画像のインペインティングはコンピュータビジョンにおける基本的なタスクであり … 続きを読む

カテゴリー: cs.CV | Diffusion Models with Anisotropic Gaussian Splatting for Image Inpainting はコメントを受け付けていません

Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation

要約 接触リッチな両手操作は、戦略的に選択された接触や動作によって物体の状態を変 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation はコメントを受け付けていません

AniGS: Animatable Gaussian Avatar from a Single Image with Inconsistent Gaussian Reconstruction

要約 1枚の画像からアニメーション可能な人体アバターを生成することは、様々なデジ … 続きを読む

カテゴリー: cs.AI, cs.CV | AniGS: Animatable Gaussian Avatar from a Single Image with Inconsistent Gaussian Reconstruction はコメントを受け付けていません

SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance

要約 最近のアプローチは、マルチステップのテキストから画像への拡散モデルを1ステ … 続きを読む

カテゴリー: cs.CV | SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance はコメントを受け付けていません

Neuro-Symbolic Evaluation of Text-to-Video Models using Formal Verification

要約 Sora、Gen-3、MovieGen、CogVideoXなど、テキストか … 続きを読む

カテゴリー: cs.AI, cs.CV | Neuro-Symbolic Evaluation of Text-to-Video Models using Formal Verification はコメントを受け付けていません

FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation

要約 画像生成モデルの目覚ましい進歩にもかかわらず、リアルな手の生成は、その複雑 … 続きを読む

カテゴリー: cs.CV | FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation はコメントを受け付けていません

Towards Neuro-Symbolic Video Understanding

要約 近年、ビデオデータの生産がかつてないほど急増しているため、下流のタスクのた … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Neuro-Symbolic Video Understanding はコメントを受け付けていません

Taming Scalable Visual Tokenizer for Autoregressive Image Generation

要約 既存のベクトル量子化(VQ)法はスケーラビリティに苦戦しており、その主な原 … 続きを読む

カテゴリー: cs.AI, cs.CV | Taming Scalable Visual Tokenizer for Autoregressive Image Generation はコメントを受け付けていません