cs.CV」カテゴリーアーカイブ

Instruction-based Image Manipulation by Watching How Things Move

要約 この論文では、ビデオからフレームのペアをサンプリングし、マルチモーダル大規 … 続きを読む

カテゴリー: cs.CV | Instruction-based Image Manipulation by Watching How Things Move はコメントを受け付けていません

Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulation

要約 GPU ベースの並列シミュレーションの最近の進歩により、実践者は大量のデー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulation はコメントを受け付けていません

Wonderland: Navigating 3D Scenes from a Single Image

要約 このペーパーでは、単一の任意の画像から高品質で広範囲の 3D シーンを効率 … 続きを読む

カテゴリー: cs.CV | Wonderland: Navigating 3D Scenes from a Single Image はコメントを受け付けていません

CAP4D: Creating Animatable 4D Portrait Avatars with Morphable Multi-View Diffusion Models

要約 画像からフォトリアリスティックでダイナミックなポートレート アバターを再構 … 続きを読む

カテゴリー: cs.CV | CAP4D: Creating Animatable 4D Portrait Avatars with Morphable Multi-View Diffusion Models はコメントを受け付けていません

Causal Diffusion Transformers for Generative Modeling

要約 拡散モデルの自己回帰 (AR) 対応物として因果拡散を導入します。 これは … 続きを読む

カテゴリー: cs.CV | Causal Diffusion Transformers for Generative Modeling はコメントを受け付けていません

PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting

要約 ポータブル 360{\deg} カメラの出現により、パノラマは仮想現実 ( … 続きを読む

カテゴリー: cs.CV | PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting はコメントを受け付けていません

BrushEdit: All-In-One Image Inpainting and Editing

要約 画像編集は、反転ベースの方法と命令ベースの方法の両方を使用した拡散モデルの … 続きを読む

カテゴリー: cs.AI, cs.CV | BrushEdit: All-In-One Image Inpainting and Editing はコメントを受け付けていません

MVQ:Towards Efficient DNN Compression and Acceleration with Masked Vector Quantization

要約 ベクトル量子化 (VQ) は、ストレージ コストとハードウェア アクセラレ … 続きを読む

カテゴリー: cs.AR, cs.CV | MVQ:Towards Efficient DNN Compression and Acceleration with Masked Vector Quantization はコメントを受け付けていません

TIV-Diffusion: Towards Object-Centric Movement for Text-driven Image to Video Generation

要約 テキスト駆動型の画像からビデオの生成 (TI2V) は、最初のフレームと対 … 続きを読む

カテゴリー: cs.CV | TIV-Diffusion: Towards Object-Centric Movement for Text-driven Image to Video Generation はコメントを受け付けていません

LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models

要約 物理的推論は、現実世界で動作するロボット エージェントに必要な重要なスキル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models はコメントを受け付けていません