cs.CV」カテゴリーアーカイブ

RefChartQA: Grounding Visual Answer on Chart Images through Instruction Tuning

要約 最近、Vision Language Models(VLM)は、より良い人 … 続きを読む

カテゴリー: cs.CV | RefChartQA: Grounding Visual Answer on Chart Images through Instruction Tuning はコメントを受け付けていません

Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation

要約 カテゴリレベルのオブジェクトのポーズ推定は、事前に定義されたカテゴリから以 … 続きを読む

カテゴリー: cs.CV | Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation はコメントを受け付けていません

Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation

要約 セマンティックセグメンテーション(DGSS)におけるオープンボキャブラリー … 続きを読む

カテゴリー: cs.CV | Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation はコメントを受け付けていません

Multimodal Large Language Models for Medical Report Generation via Customized Prompt Tuning

要約 イメージングデータからの医療報告書の生成は、臨床診療における困難なタスクの … 続きを読む

カテゴリー: cs.CV | Multimodal Large Language Models for Medical Report Generation via Customized Prompt Tuning はコメントを受け付けていません

GenHOI: Generalizing Text-driven 4D Human-Object Interaction Synthesis for Unseen Objects

要約 拡散モデルと大規模なモーションデータセットは、テキスト駆動型のヒトモーショ … 続きを読む

カテゴリー: cs.AI, cs.CV | GenHOI: Generalizing Text-driven 4D Human-Object Interaction Synthesis for Unseen Objects はコメントを受け付けていません

Unsourced Adversarial CAPTCHA: A Bi-Phase Adversarial CAPTCHA Framework

要約 深い学習の急速な進歩により、従来のキャプチャスキームは、深いニューラルネッ … 続きを読む

カテゴリー: cs.CR, cs.CV | Unsourced Adversarial CAPTCHA: A Bi-Phase Adversarial CAPTCHA Framework はコメントを受け付けていません

Advanced cervical cancer classification: enhancing pap smear images with hybrid PMD Filter-CLAHE

要約 子宮頸がんは、特に発展途上国では重大な健康問題のままです。 効果的な治療に … 続きを読む

カテゴリー: cs.CV, eess.IV | Advanced cervical cancer classification: enhancing pap smear images with hybrid PMD Filter-CLAHE はコメントを受け付けていません

Pixel-level Certified Explanations via Randomized Smoothing

要約 事後帰属方法は、影響力のある入力ピクセルを強調することにより、深い学習予測 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Pixel-level Certified Explanations via Randomized Smoothing はコメントを受け付けていません

Translation-Equivariance of Normalization Layers and Aliasing in Convolutional Neural Networks

要約 連続的な翻訳と正確に同等の畳み込み神経アーキテクチャの設計は、研究の積極的 … 続きを読む

カテゴリー: cs.CV | Translation-Equivariance of Normalization Layers and Aliasing in Convolutional Neural Networks はコメントを受け付けていません

NTIRE 2025 Image Shadow Removal Challenge Report

要約 この作業では、NTIRE 2025 Shadow Removal Chal … 続きを読む

カテゴリー: cs.CV | NTIRE 2025 Image Shadow Removal Challenge Report はコメントを受け付けていません