-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence
要約 異なるビューにわたる 2 つの画像間のオブジェクトレベルの変化を検出するこ … 続きを読む
A Comprehensive Survey of Foundation Models in Medicine
要約 基礎モデル (FM) は、多くの場合、自己教師あり学習手法を使用して、大規 … 続きを読む
Unified Face Matching and Physical-Digital Spoofing Attack Detection
要約 顔認識テクノロジーは、セキュリティ、監視、認証システムの状況を劇的に変革し … 続きを読む
カテゴリー: cs.CV
Unified Face Matching and Physical-Digital Spoofing Attack Detection はコメントを受け付けていません
A Comparative Study on Multi-task Uncertainty Quantification in Semantic Segmentation and Monocular Depth Estimation
要約 ディープ ニューラル ネットワークは、セマンティック セグメンテーションや … 続きを読む
VIS-MAE: An Efficient Self-supervised Learning Approach on Medical Image Segmentation and Classification
要約 人工知能 (AI) は、医療画像における診断とセグメンテーションに革命をも … 続きを読む
Robin: a Suite of Multi-Scale Vision-Language Models and the CHIRP Evaluation Benchmark
要約 過去数年間における視覚言語モデル (VLM) の急増により、厳密かつ包括的 … 続きを読む
Super-class guided Transformer for Zero-Shot Attribute Classification
要約 属性分類は、画像領域内の特定の特徴を識別するために重要です。 ビジョン言語 … 続きを読む
カテゴリー: cs.CV
Super-class guided Transformer for Zero-Shot Attribute Classification はコメントを受け付けていません
Vulnerability-Aware Spatio-Temporal Learning for Generalizable and Interpretable Deepfake Video Detection
要約 偽造シーケンスには空間的および時間的なアーチファクトが複雑に絡み合っている … 続きを読む
カテゴリー: cs.CV
Vulnerability-Aware Spatio-Temporal Learning for Generalizable and Interpretable Deepfake Video Detection はコメントを受け付けていません
Fine-Grained Image-Text Correspondence with Cost Aggregation for Open-Vocabulary Part Segmentation
要約 Open-Vocabulary Part Segmentation (OV … 続きを読む
カテゴリー: cs.CV
Fine-Grained Image-Text Correspondence with Cost Aggregation for Open-Vocabulary Part Segmentation はコメントを受け付けていません
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key
要約 幻覚は依然として大規模視覚言語モデル (LVLM) にとって大きな課題です … 続きを読む
カテゴリー: cs.CV
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key はコメントを受け付けていません