投稿者「jarxiv」のアーカイブ

Human Pose-Constrained UV Map Estimation

要約 UV マップ推定は、コンピューター ビジョンで人間の姿勢や活動を詳細に分析 … 続きを読む

カテゴリー: cs.CV | コメントする

IDEA: Image Description Enhanced CLIP-Adapter

要約 CLIP (Contrastive Language-Image Pre- … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution

要約 最近、拡散ベースのブラインド超解像 (SR) 手法は、豊富な高周波ディテー … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents

要約 マルチモーダル ドキュメント検索は、広範なドキュメントから図、表、チャート … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | コメントする

Evaluation of radiomic feature harmonization techniques for benign and malignant pulmonary nodules

要約 背景: ラジオミクスは、肺がんの診断に役立つ肺結節 (PN) の定量的特徴 … 続きを読む

カテゴリー: cs.CV, physics.med-ph | コメントする

MANTA: Diffusion Mamba for Efficient and Effective Stochastic Long-Term Dense Anticipation

要約 私たちの研究は、確率論的長期密予測の問題に取り組んでいます。 このタスクの … 続きを読む

カテゴリー: cs.CV | コメントする

Exploring Task-Level Optimal Prompts for Visual In-Context Learning

要約 近年の Vision Foundation Models (VFM) の開 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Generative Planning with 3D-vision Language Pre-training for End-to-End Autonomous Driving

要約 自動運転は、安全な軌道計画を立てるために周囲の環境を認識して理解する必要が … 続きを読む

カテゴリー: cs.CV | コメントする

CGCOD: Class-Guided Camouflaged Object Detection

要約 カモフラージュオブジェクト検出 (COD) は、周囲にシームレスに溶け込む … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

The Surprising Ineffectiveness of Pre-Trained Visual Representations for Model-Based Reinforcement Learning

要約 視覚強化学習 (RL) 手法では、多くの場合、大量のデータが必要になります … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする