-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
DepthFM: Fast Monocular Depth Estimation with Flow Matching
要約 現在の識別的深度推定方法では、ぼやけたアーティファクトが生成されることがよ … 続きを読む
カテゴリー: cs.CV
DepthFM: Fast Monocular Depth Estimation with Flow Matching はコメントを受け付けていません
Knowing Where to Focus: Attention-Guided Alignment for Text-based Person Search
要約 テキストベースの人物検索 (TBPS) の領域では、主流の手法は、テキスト … 続きを読む
カテゴリー: cs.CV
Knowing Where to Focus: Attention-Guided Alignment for Text-based Person Search はコメントを受け付けていません
Does VLM Classification Benefit from LLM Description Semantics?
要約 画像をテキストで正確に記述することは、説明可能な AI の基礎です。 CL … 続きを読む
カテゴリー: cs.CV
Does VLM Classification Benefit from LLM Description Semantics? はコメントを受け付けていません
Parallelized Autoregressive Visual Generation
要約 自己回帰モデルは、ビジュアル生成のための強力なアプローチとして登場しました … 続きを読む
カテゴリー: cs.CV
Parallelized Autoregressive Visual Generation はコメントを受け付けていません
Jet: A Modern Transformer-Based Normalizing Flow
要約 これまで、生成フローの正規化は、自然画像の生成モデルの有望なクラスとして浮 … 続きを読む
Leveraging Color Channel Independence for Improved Unsupervised Object Detection
要約 オブジェクト中心のアーキテクチャは、ビジュアル シーンから個別のオブジェク … 続きを読む
Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM
要約 テキストからビデオへのモデルは、高品質のテキストとビデオのペアの最適化を通 … 続きを読む
OnlineVPO: Align Video Diffusion Model with Online Video-Centric Preference Optimization
要約 近年、テキストからビデオ (T2V) 生成の分野が大幅に進歩しました。 こ … 続きを読む
カテゴリー: cs.CV
OnlineVPO: Align Video Diffusion Model with Online Video-Centric Preference Optimization はコメントを受け付けていません
SqueezeMe: Efficient Gaussian Avatars for VR
要約 ガウス スプラッティングにより、前例のないレベルの視覚品質を備えたリアルタ … 続きを読む
カテゴリー: cs.CV
SqueezeMe: Efficient Gaussian Avatars for VR はコメントを受け付けていません
Tracing the Roots: Leveraging Temporal Dynamics in Diffusion Trajectories for Origin Attribution
要約 拡散モデルは画像合成に革命をもたらし、近年大きな研究の関心を集めています。 … 続きを読む
カテゴリー: cs.CV
Tracing the Roots: Leveraging Temporal Dynamics in Diffusion Trajectories for Origin Attribution はコメントを受け付けていません