-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
VerA: Versatile Anonymization Applicable to Clinical Facial Photographs
要約 顔画像の配布におけるプライバシーの要求は、GDPR、DPDPA、CCPA、 … 続きを読む
FocusLLaVA: A Coarse-to-Fine Approach for Efficient and Effective Visual Token Compression
要約 マルチモーダル大規模言語モデルの最近の進歩により、高解像度の画像入力がモデ … 続きを読む
カテゴリー: cs.CV
FocusLLaVA: A Coarse-to-Fine Approach for Efficient and Effective Visual Token Compression はコメントを受け付けていません
AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection
要約 物体検出は多くの安全性が重要なアプリケーションに不可欠なものとなるため、そ … 続きを読む
CP-UNet: Contour-based Probabilistic Model for Medical Ultrasound Images Segmentation
要約 深層学習ベースのセグメンテーション手法は、超音波画像内の病変を検出するため … 続きを読む
High-performance real-world optical computing trained by in situ gradient-based model-free optimization
要約 光コンピューティング システムは高速かつ低エネルギーのデータ処理を提供しま … 続きを読む
カテゴリー: cs.CV, cs.ET, cs.LG, physics.optics
High-performance real-world optical computing trained by in situ gradient-based model-free optimization はコメントを受け付けていません
VG-SSL: Benchmarking Self-supervised Representation Learning Approaches for Visual Geo-localization
要約 視覚的地理位置特定 (VG) は、特にロボットや車両の自律ナビゲーションに … 続きを読む
カテゴリー: cs.CV
VG-SSL: Benchmarking Self-supervised Representation Learning Approaches for Visual Geo-localization はコメントを受け付けていません
Guided MRI Reconstruction via Schrödinger Bridge
要約 磁気共鳴画像法 (MRI) は、異なるコントラスト画像が同様の構造情報を共 … 続きを読む
Dual Attention Model with Reinforcement Learning for Classification of Histology Whole-Slide Images
要約 デジタル全体スライド画像 (WSI) は通常、顕微鏡解像度でキャプチャされ … 続きを読む
Looking Beyond Text: Reducing Language bias in Large Vision-Language Models via Multimodal Dual-Attention and Soft-Image Guidance
要約 大規模ビジョン言語モデル (LVLM) は、さまざまなビジョン言語タスクで … 続きを読む
EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild
要約 私たちの研究は、単一視点の画像から手とオブジェクトのインタラクションを再構 … 続きを読む
カテゴリー: cs.CV
EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild はコメントを受け付けていません