-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning
要約 最近のテキスト間拡散モデルは、トレーニングデータとモデルパラメーターの広範 … 続きを読む
カテゴリー: cs.CV
From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning はコメントを受け付けていません
Survey of Video Diffusion Models: Foundations, Implementations, and Applications
要約 拡散モデルの最近の進歩により、ビデオ生成に革命をもたらし、従来の生成的敵対 … 続きを読む
MR. Video: ‘MapReduce’ is the Principle for Long Video Understanding
要約 MRを提案します。 ビデオ、長いビデオを処理するためのシンプルで効果的なM … 続きを読む
カテゴリー: cs.CV
MR. Video: ‘MapReduce’ is the Principle for Long Video Understanding はコメントを受け付けていません
MMInference: Accelerating Pre-filling for Long-Context VLMs via Modality-Aware Permutation Sparse Attention
要約 長いコンテキスト機能と視覚的理解の統合は、ビジョン言語モデル(VLM)の前 … 続きを読む
Distribution-aware Forgetting Compensation for Exemplar-Free Lifelong Person Re-identification
要約 生涯にわたる人の再識別(LREID)は、新しい情報に適応しながら古い知識を … 続きを読む
VistaDepth: Frequency Modulation With Bias Reweighting For Enhanced Long-Range Depth Estimation
要約 単眼深度推定(MDE)は、単一のRGB画像からピクセルあたりの深度値を予測 … 続きを読む
カテゴリー: cs.CV
VistaDepth: Frequency Modulation With Bias Reweighting For Enhanced Long-Range Depth Estimation はコメントを受け付けていません
DRAWER: Digital Reconstruction and Articulation With Environment Realism
要約 現実世界のデータから仮想デジタルレプリカを作成すると、ゲームやロボット工学 … 続きを読む
Phoenix: A Motion-based Self-Reflection Framework for Fine-grained Robotic Action Correction
要約 一般化可能な自己修正システムの構築は、ロボットが障害から回復するために重要 … 続きを読む
GFreeDet: Exploiting Gaussian Splatting and Foundation Models for Model-free Unseen Object Detection in the BOP Challenge 2024
要約 GFREEDETは、モデルのない設定でガウスのスプラッティングとビジョンフ … 続きを読む
Latent Representations for Visual Proprioception in Inexpensive Robots
要約 ロボット操作には、ロボットの関節位置に関する明示的または暗黙的な知識が必要 … 続きを読む