-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation
要約 拡散モデルの急速な進歩は、通常、ユーザーエクスペリエンスにシーンレベルの4 … 続きを読む
カテゴリー: cs.CV
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation はコメントを受け付けていません
Vision Transformers on the Edge: A Comprehensive Survey of Model Compression and Acceleration Strategies
要約 近年、視覚変圧器(VITS)は、画像分類、オブジェクト検出、セグメンテーシ … 続きを読む
Visual Text Processing: A Comprehensive Review and Unified Evaluation
要約 視覚テキストは、ドキュメント画像とシーン画像の両方で重要なコンポーネントで … 続きを読む
カテゴリー: cs.CV
Visual Text Processing: A Comprehensive Review and Unified Evaluation はコメントを受け付けていません
Segmentation-Aware Generative Reinforcement Network (GRN) for Tissue Layer Segmentation in 3-D Ultrasound Images for Chronic Low-back Pain (cLBP) Assessment
要約 セグメンテーション損失フィードバックを統合して、単一の段階で画像生成とセグ … 続きを読む
Garment3DGen: 3D Garment Stylization and Texture Generation
要約 Garment3Dgenに、ガイダンスとして単一の入力画像を与えられたベー … 続きを読む
カテゴリー: cs.CV
Garment3DGen: 3D Garment Stylization and Texture Generation はコメントを受け付けていません
Enhancing Self-Supervised Fine-Grained Video Object Tracking with Dynamic Memory Prediction
要約 成功したビデオ分析は、フレーム全体のピクセルの正確な認識に依存しており、ビ … 続きを読む
PixelHacker: Image Inpainting with Structural and Semantic Consistency
要約 画像の開始は、画像編集と画像生成の間の基本的な研究領域です。 最近の最先端 … 続きを読む
カテゴリー: cs.CV
PixelHacker: Image Inpainting with Structural and Semantic Consistency はコメントを受け付けていません
BiPrompt-SAM: Enhancing Image Segmentation via Explicit Selection between Point and Text Prompts
要約 セグメンテーションはコンピュータービジョンの基本的なタスクであり、柔軟性の … 続きを読む
REHEARSE-3D: A Multi-modal Emulated Rain Dataset for 3D Point Cloud De-raining
要約 センサーの劣化は、自律運転において大きな課題をもたらします。 大雨の間、雨 … 続きを読む
Vision Transformers in Precision Agriculture: A Comprehensive Survey
要約 植物の病気を検出することは、現代の農業の重要な側面です。作物の健康を維持し … 続きを読む