cs.CV」カテゴリーアーカイブ

Enhancing Autonomous Navigation by Imaging Hidden Objects using Single-Photon LiDAR

要約 ロボット工学において、視界の限られた環境下でのロバストな自律ナビゲーション … 続きを読む

カテゴリー: cs.CV, cs.RO | Enhancing Autonomous Navigation by Imaging Hidden Objects using Single-Photon LiDAR はコメントを受け付けていません

Not All Diffusion Model Activations Have Been Evaluated as Discriminative Features

要約 拡散モデルは当初、画像生成のために設計された。最近の研究により、そのバック … 続きを読む

カテゴリー: cs.AI, cs.CV | Not All Diffusion Model Activations Have Been Evaluated as Discriminative Features はコメントを受け付けていません

VideoCLIP-XL: Advancing Long Description Understanding for Video CLIP Models

要約 対照的言語イメージ事前学習(CLIP)は広く研究され、多くのアプリケーショ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | VideoCLIP-XL: Advancing Long Description Understanding for Video CLIP Models はコメントを受け付けていません

Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models

要約 その素晴らしい能力にもかかわらず、マルチモーダル大規模言語モデル(MLLM … 続きを読む

カテゴリー: cs.CV | Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models はコメントを受け付けていません

Lessons Learned from a Unifying Empirical Study of Parameter-Efficient Transfer Learning (PETL) in Visual Recognition

要約 パラメータ効率的伝達学習(PETL)は、事前学習されたモデルのサイズが大き … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Lessons Learned from a Unifying Empirical Study of Parameter-Efficient Transfer Learning (PETL) in Visual Recognition はコメントを受け付けていません

Data Diet: Can Trimming PET/CT Datasets Enhance Lesion Segmentation?

要約 この研究では、autoPET3データセントリックトラックに出場するための我 … 続きを読む

カテゴリー: cs.CV, eess.IV | Data Diet: Can Trimming PET/CT Datasets Enhance Lesion Segmentation? はコメントを受け付けていません

Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise

要約 近年、ノイズ除去拡散モデルの研究は、画像復元の分野にも応用を広げている。従 … 続きを読む

カテゴリー: cs.AI, cs.CV | Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise はコメントを受け付けていません

Variational Bayes Gaussian Splatting

要約 近年、3Dガウススプラッティングは、ガウスの混合を使用して3Dシーンをモデ … 続きを読む

カテゴリー: cs.AI, cs.CV | Variational Bayes Gaussian Splatting はコメントを受け付けていません

Unraveling the Truth: Do VLMs really Understand Charts? A Deep Dive into Consistency and Robustness

要約 図表質問応答(CQA)は、視覚言語理解の重要な分野である。しかし、この分野 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | Unraveling the Truth: Do VLMs really Understand Charts? A Deep Dive into Consistency and Robustness はコメントを受け付けていません

AID: Attention Interpolation of Text-to-Image Diffusion

要約 条件拡散モデルは、様々な環境において未見の画像を作成し、画像補間を支援する … 続きを読む

カテゴリー: cs.AI, cs.CV | AID: Attention Interpolation of Text-to-Image Diffusion はコメントを受け付けていません