cs.CV」カテゴリーアーカイブ

Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric

要約 AI を活用したビデオ生成技術は近年大幅に進歩しました。 ただし、人間の活 … 続きを読む

カテゴリー: cs.CV | Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric はコメントを受け付けていません

Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval

要約 テキストから画像への人物検索 (TIPR) の目的は、指定されたテキストの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval はコメントを受け付けていません

Imperceptible Adversarial Examples in the Physical World

要約 ディープラーニングベースのコンピュータービジョンモデルに対するデジタルドメ … 続きを読む

カテゴリー: cs.AI, cs.CV | Imperceptible Adversarial Examples in the Physical World はコメントを受け付けていません

LegoPET: Hierarchical Feature Guided Conditional Diffusion for PET Image Reconstruction

要約 陽電子放射断層撮影法 (PET) は、生体内での機能的および生物学的プロセ … 続きを読む

カテゴリー: cs.CV, eess.IV | LegoPET: Hierarchical Feature Guided Conditional Diffusion for PET Image Reconstruction はコメントを受け付けていません

Word4Per: Zero-shot Composed Person Retrieval

要約 特定の人物の検索には大きな社会的利点とセキュリティ上の価値があり、多くの場 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR | Word4Per: Zero-shot Composed Person Retrieval はコメントを受け付けていません

DocPedia: Unleashing the Power of Large Multimodal Model in the Frequency Domain for Versatile Document Understanding

要約 この研究では、最大 2,560$\times$2,560 の解像度で画像を … 続きを読む

カテゴリー: cs.AI, cs.CV | DocPedia: Unleashing the Power of Large Multimodal Model in the Frequency Domain for Versatile Document Understanding はコメントを受け付けていません

Enhancing Multimodal Medical Image Classification using Cross-Graph Modal Contrastive Learning

要約 医療画像の分類は疾患診断の極めて重要な側面であり、多くの場合、ディープラー … 続きを読む

カテゴリー: cs.CV, eess.IV | Enhancing Multimodal Medical Image Classification using Cross-Graph Modal Contrastive Learning はコメントを受け付けていません

DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation

要約 ストーリーテリング ビデオ生成 (SVG) は、入力テキスト スクリプトで … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation はコメントを受け付けていません

Edge Weight Prediction For Category-Agnostic Pose Estimation

要約 カテゴリ非依存ポーズ推定 (CAPE) は、1 つまたは少数の注釈付きサポ … 続きを読む

カテゴリー: cs.CV | Edge Weight Prediction For Category-Agnostic Pose Estimation はコメントを受け付けていません

Diffusion Features for Zero-Shot 6DoF Object Pose Estimation

要約 ゼロショット オブジェクトの姿勢推定により、オブジェクト固有のトレーニング … 続きを読む

カテゴリー: 68T45, cs.CV, I.4.8 | Diffusion Features for Zero-Shot 6DoF Object Pose Estimation はコメントを受け付けていません