-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
UI-TARS: Pioneering Automated GUI Interaction with Native Agents
要約 このペーパーでは、スクリーンショットを入力としてのみ認識し、人間のような対 … 続きを読む
VARGPT: Unified Understanding and Generation in a Visual Autoregressive Multimodal Large Language Model
要約 単一の自己回帰フレームワーク内で視覚的な理解と生成を統合する、新しいマルチ … 続きを読む
カテゴリー: cs.CV
VARGPT: Unified Understanding and Generation in a Visual Autoregressive Multimodal Large Language Model はコメントを受け付けていません
Cinepro: Robust Training of Foundation Models for Cancer Detection in Prostate Ultrasound Cineloops
要約 深層学習 (DL) モデルを使用した前立腺がん (PCa) 検出は、生検中 … 続きを読む
Vision-Language Models for Automated Chest X-ray Interpretation: Leveraging ViT and GPT-2
要約 放射線医学は、その非侵襲的な診断能力により、現代医学において極めて重要な役 … 続きを読む
カテゴリー: cs.CV
Vision-Language Models for Automated Chest X-ray Interpretation: Leveraging ViT and GPT-2 はコメントを受け付けていません
InternLM-XComposer2.5-Reward: A Simple Yet Effective Multi-Modal Reward Model
要約 Large Vision Language Model (LVLM) は視 … 続きを読む
DARB-Splatting: Generalizing Splatting with Decaying Anisotropic Radial Basis Functions
要約 スプラッティング ベースの 3D 再構成手法は、3D ガウス スプラッティ … 続きを読む
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos
要約 Depth Anything は、強力な一般化能力により、単眼の深度推定に … 続きを読む
MMVU: Measuring Expert-Level Multi-Discipline Video Understanding
要約 ビデオ理解における基礎モデルを評価するための、専門家レベルの包括的な複数分 … 続きを読む
Parallel Sequence Modeling via Generalized Spatial Propagation Network
要約 本質的に 2D 空間構造を捕捉する視覚タスク用に最適化された新しい注意メカ … 続きを読む
DiffDoctor: Diagnosing Image Diffusion Models Before Treating
要約 最近の進歩にもかかわらず、画像拡散モデルは依然としてアーチファクトを生成し … 続きを読む
カテゴリー: cs.CV
DiffDoctor: Diagnosing Image Diffusion Models Before Treating はコメントを受け付けていません