cs.CV」カテゴリーアーカイブ

Lux Post Facto: Learning Portrait Performance Relighting with Conditional Video Diffusion and a Hybrid Dataset

要約 結果は光選挙的で一時的に安定している必要があるため、ビデオのポートレートの … 続きを読む

カテゴリー: cs.CV, cs.GR | Lux Post Facto: Learning Portrait Performance Relighting with Conditional Video Diffusion and a Hybrid Dataset はコメントを受け付けていません

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

要約 拡散モデルは、さまざまな画像生成タスクで顕著な成功を示していますが、さまざ … 続きを読む

カテゴリー: cs.AI, cs.CV | DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers はコメントを受け付けていません

Stable Virtual Camera: Generative View Synthesis with Diffusion Models

要約 安定した仮想カメラ(SEVA)を提示します。これは、入力ビューとターゲット … 続きを読む

カテゴリー: cs.CV | Stable Virtual Camera: Generative View Synthesis with Diffusion Models はコメントを受け付けていません

Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control

要約 セグメンテーション、深さ、エッジなどのさまざまなモダリティの複数の空間制御 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control はコメントを受け付けていません

State Space Model Meets Transformer: A New Paradigm for 3D Object Detection

要約 マルチレイヤートランスデコーダーを使用してオブジェクトクエリを繰り返し改良 … 続きを読む

カテゴリー: cs.AI, cs.CV | State Space Model Meets Transformer: A New Paradigm for 3D Object Detection はコメントを受け付けていません

Deeply Supervised Flow-Based Generative Models

要約 フローベースの生成モデルは、単純な原理、つまり線形補間の学習速度表現を学習 … 続きを読む

カテゴリー: cs.CV | Deeply Supervised Flow-Based Generative Models はコメントを受け付けていません

Tracking Meets Large Multimodal Models for Driving Scenario Understanding

要約 大規模なマルチモーダルモデル(LMM)は最近、自律運転研究で顕著になり、さ … 続きを読む

カテゴリー: cs.CV, cs.RO | Tracking Meets Large Multimodal Models for Driving Scenario Understanding はコメントを受け付けていません

Utilization of Neighbor Information for Image Classification with Different Levels of Supervision

要約 一般化されたカテゴリ発見(GCD)と画像クラスタリングの両方でうまく機能す … 続きを読む

カテゴリー: cs.CV, cs.LG | Utilization of Neighbor Information for Image Classification with Different Levels of Supervision はコメントを受け付けていません

Advances in 4D Generation: A Survey

要約 生成的人工知能は、近年、複数のドメインにわたって顕著な進歩を目撃しています … 続きを読む

カテゴリー: cs.CV | Advances in 4D Generation: A Survey はコメントを受け付けていません

The Power of Context: How Multimodality Improves Image Super-Resolution

要約 シングルイメージの超解像度(SISR)は、細かい詳細を回復し、低解像度の入 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | The Power of Context: How Multimodality Improves Image Super-Resolution はコメントを受け付けていません