投稿者「jarxiv」のアーカイブ

Garment3DGen: 3D Garment Stylization and Texture Generation

要約 Garment3Dgenに、ガイダンスとして単一の入力画像を与えられたベー … 続きを読む

カテゴリー: cs.CV | コメントする

Enhancing Self-Supervised Fine-Grained Video Object Tracking with Dynamic Memory Prediction

要約 成功したビデオ分析は、フレーム全体のピクセルの正確な認識に依存しており、ビ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

PixelHacker: Image Inpainting with Structural and Semantic Consistency

要約 画像の開始は、画像編集と画像生成の間の基本的な研究領域です。 最近の最先端 … 続きを読む

カテゴリー: cs.CV | コメントする

BiPrompt-SAM: Enhancing Image Segmentation via Explicit Selection between Point and Text Prompts

要約 セグメンテーションはコンピュータービジョンの基本的なタスクであり、柔軟性の … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

REHEARSE-3D: A Multi-modal Emulated Rain Dataset for 3D Point Cloud De-raining

要約 センサーの劣化は、自律運転において大きな課題をもたらします。 大雨の間、雨 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Vision Transformers in Precision Agriculture: A Comprehensive Survey

要約 植物の病気を検出することは、現代の農業の重要な側面です。作物の健康を維持し … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

T2VEval: Benchmark Dataset and Objective Evaluation Method for T2V-generated Videos

要約 Runway Gen-3、Pika、Sora、Klingなどのモデルで実証 … 続きを読む

カテゴリー: cs.CV | コメントする

Leveraging Motion Information for Better Self-Supervised Video Correspondence Learning

要約 自己教師のビデオ通信学習は、同じ視覚オブジェクトに対応するビデオフレーム間 … 続きを読む

カテゴリー: cs.CV | コメントする

VividListener: Expressive and Controllable Listener Dynamics Modeling for Multi-Modal Responsive Interaction

要約 さまざまな仮想アバターアニメーションでの実際的な対話モデリングには、微妙な … 続きを読む

カテゴリー: cs.CV | コメントする

Comparison of Kinematics and Kinetics Between OpenCap and a Marker-Based Motion Capture System in Cycling

要約 この研究では、サイクリング中の関節運動学と速度論の評価におけるマーカーベー … 続きを読む

カテゴリー: cs.CV | コメントする