cs.CV」カテゴリーアーカイブ

DepthFM: Fast Monocular Depth Estimation with Flow Matching

要約 現在の識別的深度推定方法では、ぼやけたアーティファクトが生成されることがよ … 続きを読む

カテゴリー: cs.CV | DepthFM: Fast Monocular Depth Estimation with Flow Matching はコメントを受け付けていません

Knowing Where to Focus: Attention-Guided Alignment for Text-based Person Search

要約 テキストベースの人物検索 (TBPS) の領域では、主流の手法は、テキスト … 続きを読む

カテゴリー: cs.CV | Knowing Where to Focus: Attention-Guided Alignment for Text-based Person Search はコメントを受け付けていません

Does VLM Classification Benefit from LLM Description Semantics?

要約 画像をテキストで正確に記述することは、説明可能な AI の基礎です。 CL … 続きを読む

カテゴリー: cs.CV | Does VLM Classification Benefit from LLM Description Semantics? はコメントを受け付けていません

Parallelized Autoregressive Visual Generation

要約 自己回帰モデルは、ビジュアル生成のための強力なアプローチとして登場しました … 続きを読む

カテゴリー: cs.CV | Parallelized Autoregressive Visual Generation はコメントを受け付けていません

Jet: A Modern Transformer-Based Normalizing Flow

要約 これまで、生成フローの正規化は、自然画像の生成モデルの有望なクラスとして浮 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Jet: A Modern Transformer-Based Normalizing Flow はコメントを受け付けていません

Leveraging Color Channel Independence for Improved Unsupervised Object Detection

要約 オブジェクト中心のアーキテクチャは、ビジュアル シーンから個別のオブジェク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.10 | Leveraging Color Channel Independence for Improved Unsupervised Object Detection はコメントを受け付けていません

Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM

要約 テキストからビデオへのモデルは、高品質のテキストとビデオのペアの最適化を通 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM はコメントを受け付けていません

OnlineVPO: Align Video Diffusion Model with Online Video-Centric Preference Optimization

要約 近年、テキストからビデオ (T2V) 生成の分野が大幅に進歩しました。 こ … 続きを読む

カテゴリー: cs.CV | OnlineVPO: Align Video Diffusion Model with Online Video-Centric Preference Optimization はコメントを受け付けていません

SqueezeMe: Efficient Gaussian Avatars for VR

要約 ガウス スプラッティングにより、前例のないレベルの視覚品質を備えたリアルタ … 続きを読む

カテゴリー: cs.CV | SqueezeMe: Efficient Gaussian Avatars for VR はコメントを受け付けていません

Tracing the Roots: Leveraging Temporal Dynamics in Diffusion Trajectories for Origin Attribution

要約 拡散モデルは画像合成に革命をもたらし、近年大きな研究の関心を集めています。 … 続きを読む

カテゴリー: cs.CV | Tracing the Roots: Leveraging Temporal Dynamics in Diffusion Trajectories for Origin Attribution はコメントを受け付けていません