「cs.CV」カテゴリーアーカイブ

D-MiSo: Editing Dynamic 3D Scenes using Multi-Gaussians Soup

投稿日: 2024年12月4日作成者: jarxiv

要約過去数年間、我々はガウススプラッティング（Gaussian Splatti … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

投稿日: 2024年12月4日作成者: jarxiv

要約本研究では、テキストから画像への変換のためのスケールワイズ変換器であるSw … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Diffusion Models with Anisotropic Gaussian Splatting for Image Inpainting

投稿日: 2024年12月4日作成者: jarxiv

要約画像のインペインティングはコンピュータビジョンにおける基本的なタスクであり … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation

投稿日: 2024年12月4日作成者: jarxiv

要約接触リッチな両手操作は、戦略的に選択された接触や動作によって物体の状態を変 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

AniGS: Animatable Gaussian Avatar from a Single Image with Inconsistent Gaussian Reconstruction

投稿日: 2024年12月4日作成者: jarxiv

要約 1枚の画像からアニメーション可能な人体アバターを生成することは、様々なデジ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance

投稿日: 2024年12月4日作成者: jarxiv

要約最近のアプローチは、マルチステップのテキストから画像への拡散モデルを1ステ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Neuro-Symbolic Evaluation of Text-to-Video Models using Formal Verification

投稿日: 2024年12月4日作成者: jarxiv

要約 Sora、Gen-3、MovieGen、CogVideoXなど、テキストか … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation

投稿日: 2024年12月4日作成者: jarxiv

要約画像生成モデルの目覚ましい進歩にもかかわらず、リアルな手の生成は、その複雑 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Towards Neuro-Symbolic Video Understanding

投稿日: 2024年12月4日作成者: jarxiv

要約近年、ビデオデータの生産がかつてないほど急増しているため、下流のタスクのた … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Taming Scalable Visual Tokenizer for Autoregressive Image Generation

投稿日: 2024年12月4日作成者: jarxiv

要約既存のベクトル量子化(VQ)法はスケーラビリティに苦戦しており、その主な原 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

D-MiSo: Editing Dynamic 3D Scenes using Multi-Gaussians Soup

Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

Diffusion Models with Anisotropic Gaussian Splatting for Image Inpainting

Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation

AniGS: Animatable Gaussian Avatar from a Single Image with Inconsistent Gaussian Reconstruction

SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance

Neuro-Symbolic Evaluation of Text-to-Video Models using Formal Verification

FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation

Towards Neuro-Symbolic Video Understanding

Taming Scalable Visual Tokenizer for Autoregressive Image Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー