-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Deep Learning Based Segmentation of Blood Vessels from H&E Stained Oesophageal Adenocarcinoma Whole-Slide Images
要約 血管(BV)は腫瘍微小環境(TME)において重要な役割を果たしており、がん … 続きを読む
Let There Be Light: Robust Lensless Imaging Under External Illumination With Deep Learning
要約 レンズレスカメラは、画像形成をアナログ光学からデジタル後処理に移行すること … 続きを読む
UI-TARS: Pioneering Automated GUI Interaction with Native Agents
要約 このペーパーでは、スクリーンショットを入力としてのみ認識し、人間のような対 … 続きを読む
VARGPT: Unified Understanding and Generation in a Visual Autoregressive Multimodal Large Language Model
要約 単一の自己回帰フレームワーク内で視覚的な理解と生成を統合する、新しいマルチ … 続きを読む
カテゴリー: cs.CV
VARGPT: Unified Understanding and Generation in a Visual Autoregressive Multimodal Large Language Model はコメントを受け付けていません
Cinepro: Robust Training of Foundation Models for Cancer Detection in Prostate Ultrasound Cineloops
要約 深層学習 (DL) モデルを使用した前立腺がん (PCa) 検出は、生検中 … 続きを読む
Vision-Language Models for Automated Chest X-ray Interpretation: Leveraging ViT and GPT-2
要約 放射線医学は、その非侵襲的な診断能力により、現代医学において極めて重要な役 … 続きを読む
カテゴリー: cs.CV
Vision-Language Models for Automated Chest X-ray Interpretation: Leveraging ViT and GPT-2 はコメントを受け付けていません
InternLM-XComposer2.5-Reward: A Simple Yet Effective Multi-Modal Reward Model
要約 Large Vision Language Model (LVLM) は視 … 続きを読む
DARB-Splatting: Generalizing Splatting with Decaying Anisotropic Radial Basis Functions
要約 スプラッティング ベースの 3D 再構成手法は、3D ガウス スプラッティ … 続きを読む
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos
要約 Depth Anything は、強力な一般化能力により、単眼の深度推定に … 続きを読む
MMVU: Measuring Expert-Level Multi-Discipline Video Understanding
要約 ビデオ理解における基礎モデルを評価するための、専門家レベルの包括的な複数分 … 続きを読む