cs.CV」カテゴリーアーカイブ

Four-Plane Factorized Video Autoencoders

要約 潜在変数生成モデルは、画像やビデオの合成などの生成タスクのための強力なツー … 続きを読む

カテゴリー: cs.CV | Four-Plane Factorized Video Autoencoders はコメントを受け付けていません

Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection

要約 オープンセット障害の自動検出と防止は、閉ループロボットシステムにおいて非常 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection はコメントを受け付けていません

Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

要約 この作品では、テキストから画像を生成するためのスケールワイズ トランスフォ … 続きを読む

カテゴリー: cs.CV | Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis はコメントを受け付けていません

HeatFormer: A Neural Optimizer for Multiview Human Mesh Recovery

要約 複数の静的ビューを完全に活用できる、人間の形状と姿勢を復元するための新しい … 続きを読む

カテゴリー: cs.CV | HeatFormer: A Neural Optimizer for Multiview Human Mesh Recovery はコメントを受け付けていません

Monocular Dynamic Gaussian Splatting is Fast and Brittle but Smooth Motion Helps

要約 ガウス スプラッティング法は、マルチビュー画像データをビュー合成を可能にす … 続きを読む

カテゴリー: cs.CV | Monocular Dynamic Gaussian Splatting is Fast and Brittle but Smooth Motion Helps はコメントを受け付けていません

Cubify Anything: Scaling Indoor 3D Object Detection

要約 市販のハンドヘルド デバイスから取得した単一の RGB(-D) フレームに … 続きを読む

カテゴリー: cs.CV | Cubify Anything: Scaling Indoor 3D Object Detection はコメントを受け付けていません

Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering

要約 私たちは、ニューラル ネットワークや 3D ガウスを使用せずに、まばらなボ … 続きを読む

カテゴリー: cs.CV, cs.GR | Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering はコメントを受け付けていません

LayerFusion: Harmonized Multi-Layer Text-to-Image Generation with Generative Priors

要約 大規模拡散モデルは、テキストの説明から高品質の画像を生成することに目覚まし … 続きを読む

カテゴリー: cs.CV | LayerFusion: Harmonized Multi-Layer Text-to-Image Generation with Generative Priors はコメントを受け付けていません

4Real-Video: Learning Generalizable Photo-Realistic 4D Video Diffusion

要約 私たちは、時間軸と視点軸の両方を持つビデオ フレームのグリッドとして編成さ … 続きを読む

カテゴリー: cs.CV | 4Real-Video: Learning Generalizable Photo-Realistic 4D Video Diffusion はコメントを受け付けていません

MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos

要約 動的シーンのカジュアルな単眼ビデオからカメラパラメータと深度マップを正確、 … 続きを読む

カテゴリー: cs.CV | MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos はコメントを受け付けていません