月別アーカイブ: 2025年5月

HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation

要約 拡散モデルの急速な進歩は、通常、ユーザーエクスペリエンスにシーンレベルの4 … 続きを読む

カテゴリー: cs.CV | HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation はコメントを受け付けていません

Vision Transformers on the Edge: A Comprehensive Survey of Model Compression and Acceleration Strategies

要約 近年、視覚変圧器(VITS)は、画像分類、オブジェクト検出、セグメンテーシ … 続きを読む

カテゴリー: cs.AR, cs.CV | Vision Transformers on the Edge: A Comprehensive Survey of Model Compression and Acceleration Strategies はコメントを受け付けていません

Visual Text Processing: A Comprehensive Review and Unified Evaluation

要約 視覚テキストは、ドキュメント画像とシーン画像の両方で重要なコンポーネントで … 続きを読む

カテゴリー: cs.CV | Visual Text Processing: A Comprehensive Review and Unified Evaluation はコメントを受け付けていません

Segmentation-Aware Generative Reinforcement Network (GRN) for Tissue Layer Segmentation in 3-D Ultrasound Images for Chronic Low-back Pain (cLBP) Assessment

要約 セグメンテーション損失フィードバックを統合して、単一の段階で画像生成とセグ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Segmentation-Aware Generative Reinforcement Network (GRN) for Tissue Layer Segmentation in 3-D Ultrasound Images for Chronic Low-back Pain (cLBP) Assessment はコメントを受け付けていません

Garment3DGen: 3D Garment Stylization and Texture Generation

要約 Garment3Dgenに、ガイダンスとして単一の入力画像を与えられたベー … 続きを読む

カテゴリー: cs.CV | Garment3DGen: 3D Garment Stylization and Texture Generation はコメントを受け付けていません

Enhancing Self-Supervised Fine-Grained Video Object Tracking with Dynamic Memory Prediction

要約 成功したビデオ分析は、フレーム全体のピクセルの正確な認識に依存しており、ビ … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Self-Supervised Fine-Grained Video Object Tracking with Dynamic Memory Prediction はコメントを受け付けていません

PixelHacker: Image Inpainting with Structural and Semantic Consistency

要約 画像の開始は、画像編集と画像生成の間の基本的な研究領域です。 最近の最先端 … 続きを読む

カテゴリー: cs.CV | PixelHacker: Image Inpainting with Structural and Semantic Consistency はコメントを受け付けていません

BiPrompt-SAM: Enhancing Image Segmentation via Explicit Selection between Point and Text Prompts

要約 セグメンテーションはコンピュータービジョンの基本的なタスクであり、柔軟性の … 続きを読む

カテゴリー: cs.CV, cs.LG | BiPrompt-SAM: Enhancing Image Segmentation via Explicit Selection between Point and Text Prompts はコメントを受け付けていません

REHEARSE-3D: A Multi-modal Emulated Rain Dataset for 3D Point Cloud De-raining

要約 センサーの劣化は、自律運転において大きな課題をもたらします。 大雨の間、雨 … 続きを読む

カテゴリー: cs.CV, cs.RO | REHEARSE-3D: A Multi-modal Emulated Rain Dataset for 3D Point Cloud De-raining はコメントを受け付けていません

Vision Transformers in Precision Agriculture: A Comprehensive Survey

要約 植物の病気を検出することは、現代の農業の重要な側面です。作物の健康を維持し … 続きを読む

カテゴリー: cs.AI, cs.CV | Vision Transformers in Precision Agriculture: A Comprehensive Survey はコメントを受け付けていません