-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Enhancing Autonomous Navigation by Imaging Hidden Objects using Single-Photon LiDAR
要約 ロボット工学において、視界の限られた環境下でのロバストな自律ナビゲーション … 続きを読む
Not All Diffusion Model Activations Have Been Evaluated as Discriminative Features
要約 拡散モデルは当初、画像生成のために設計された。最近の研究により、そのバック … 続きを読む
VideoCLIP-XL: Advancing Long Description Understanding for Video CLIP Models
要約 対照的言語イメージ事前学習(CLIP)は広く研究され、多くのアプリケーショ … 続きを読む
Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models
要約 その素晴らしい能力にもかかわらず、マルチモーダル大規模言語モデル(MLLM … 続きを読む
カテゴリー: cs.CV
Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models はコメントを受け付けていません
Lessons Learned from a Unifying Empirical Study of Parameter-Efficient Transfer Learning (PETL) in Visual Recognition
要約 パラメータ効率的伝達学習(PETL)は、事前学習されたモデルのサイズが大き … 続きを読む
Data Diet: Can Trimming PET/CT Datasets Enhance Lesion Segmentation?
要約 この研究では、autoPET3データセントリックトラックに出場するための我 … 続きを読む
Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise
要約 近年、ノイズ除去拡散モデルの研究は、画像復元の分野にも応用を広げている。従 … 続きを読む
Variational Bayes Gaussian Splatting
要約 近年、3Dガウススプラッティングは、ガウスの混合を使用して3Dシーンをモデ … 続きを読む
Unraveling the Truth: Do VLMs really Understand Charts? A Deep Dive into Consistency and Robustness
要約 図表質問応答(CQA)は、視覚言語理解の重要な分野である。しかし、この分野 … 続きを読む
AID: Attention Interpolation of Text-to-Image Diffusion
要約 条件拡散モデルは、様々な環境において未見の画像を作成し、画像補間を支援する … 続きを読む