-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling
要約 正規の製品ビュー内の分離された衣服の画像と人物の別個の画像が与えられた場合 … 続きを読む
カテゴリー: cs.CV
Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling はコメントを受け付けていません
Are They the Same? Exploring Visual Correspondence Shortcomings of Multimodal LLMs
要約 マルチモーダル モデルの最近の進歩により、視覚認識、推論能力、視覚言語理解 … 続きを読む
カテゴリー: cs.CV
Are They the Same? Exploring Visual Correspondence Shortcomings of Multimodal LLMs はコメントを受け付けていません
DRIVINGVQA: Analyzing Visual Chain-of-Thought Reasoning of Vision Language Models in Real-World Scenarios with Driving Theory Tests
要約 Large Vision-Language Model (LVLM) は、 … 続きを読む
GLoG-CSUnet: Enhancing Vision Transformers with Adaptable Radiomic Features for Medical Image Segmentation
要約 ビジョン トランスフォーマー (ViT) は、長距離相関を捕捉することによ … 続きを読む
Enhancing Financial VQA in Vision Language Models using Intermediate Structured Representations
要約 グラフの解釈は視覚的なデータ分析にとって重要ですが、グラフから情報を正確に … 続きを読む
RadGPT: Constructing 3D Image-Text Tumor Datasets
要約 米国では年間 8,500 万件を超える CT スキャンが実行されており、放 … 続きを読む
SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images
要約 単一画像の 3D オブジェクトの再構成の問題を研究します。 最近の研究は、 … 続きを読む
Re-ranking the Context for Multimodal Retrieval Augmented Generation
要約 検索拡張生成 (RAG) は、外部知識を組み込んで大規模言語モデル (LL … 続きを読む
Test-Time Optimization for Domain Adaptive Open Vocabulary Segmentation
要約 特殊なドメイン タスクで優れた性能を発揮するように設計された、ゼロショット … 続きを読む
カテゴリー: cs.CV
Test-Time Optimization for Domain Adaptive Open Vocabulary Segmentation はコメントを受け付けていません