「cs.CV」カテゴリーアーカイブ

Lux Post Facto: Learning Portrait Performance Relighting with Conditional Video Diffusion and a Hybrid Dataset

投稿日: 2025年3月19日作成者: jarxiv

要約結果は光選挙的で一時的に安定している必要があるため、ビデオのポートレートの … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

投稿日: 2025年3月19日作成者: jarxiv

要約拡散モデルは、さまざまな画像生成タスクで顕著な成功を示していますが、さまざ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Stable Virtual Camera: Generative View Synthesis with Diffusion Models

投稿日: 2025年3月19日作成者: jarxiv

要約安定した仮想カメラ（SEVA）を提示します。これは、入力ビューとターゲット … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control

投稿日: 2025年3月19日作成者: jarxiv

要約セグメンテーション、深さ、エッジなどのさまざまなモダリティの複数の空間制御 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

State Space Model Meets Transformer: A New Paradigm for 3D Object Detection

投稿日: 2025年3月19日作成者: jarxiv

要約マルチレイヤートランスデコーダーを使用してオブジェクトクエリを繰り返し改良 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Deeply Supervised Flow-Based Generative Models

投稿日: 2025年3月19日作成者: jarxiv

要約フローベースの生成モデルは、単純な原理、つまり線形補間の学習速度表現を学習 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Tracking Meets Large Multimodal Models for Driving Scenario Understanding

投稿日: 2025年3月19日作成者: jarxiv

要約大規模なマルチモーダルモデル（LMM）は最近、自律運転研究で顕著になり、さ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Utilization of Neighbor Information for Image Classification with Different Levels of Supervision

投稿日: 2025年3月19日作成者: jarxiv

要約一般化されたカテゴリ発見（GCD）と画像クラスタリングの両方でうまく機能す … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Advances in 4D Generation: A Survey

投稿日: 2025年3月19日作成者: jarxiv

要約生成的人工知能は、近年、複数のドメインにわたって顕著な進歩を目撃しています … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

The Power of Context: How Multimodality Improves Image Super-Resolution

投稿日: 2025年3月19日作成者: jarxiv

要約シングルイメージの超解像度（SISR）は、細かい詳細を回復し、低解像度の入 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Lux Post Facto: Learning Portrait Performance Relighting with Conditional Video Diffusion and a Hybrid Dataset

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Stable Virtual Camera: Generative View Synthesis with Diffusion Models

Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control

State Space Model Meets Transformer: A New Paradigm for 3D Object Detection

Deeply Supervised Flow-Based Generative Models

Tracking Meets Large Multimodal Models for Driving Scenario Understanding

Utilization of Neighbor Information for Image Classification with Different Levels of Supervision

Advances in 4D Generation: A Survey

The Power of Context: How Multimodality Improves Image Super-Resolution

最近の投稿

最近のコメント

アーカイブ

カテゴリー