「cs.CV」カテゴリーアーカイブ

RefChartQA: Grounding Visual Answer on Chart Images through Instruction Tuning

投稿日: 2025年6月19日作成者: jarxiv

要約最近、Vision Language Models（VLM）は、より良い人 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation

投稿日: 2025年6月19日作成者: jarxiv

要約カテゴリレベルのオブジェクトのポーズ推定は、事前に定義されたカテゴリから以 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation

投稿日: 2025年6月19日作成者: jarxiv

要約セマンティックセグメンテーション（DGSS）におけるオープンボキャブラリー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multimodal Large Language Models for Medical Report Generation via Customized Prompt Tuning

投稿日: 2025年6月19日作成者: jarxiv

要約イメージングデータからの医療報告書の生成は、臨床診療における困難なタスクの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GenHOI: Generalizing Text-driven 4D Human-Object Interaction Synthesis for Unseen Objects

投稿日: 2025年6月19日作成者: jarxiv

要約拡散モデルと大規模なモーションデータセットは、テキスト駆動型のヒトモーショ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Unsourced Adversarial CAPTCHA: A Bi-Phase Adversarial CAPTCHA Framework

投稿日: 2025年6月19日作成者: jarxiv

要約深い学習の急速な進歩により、従来のキャプチャスキームは、深いニューラルネッ … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

Advanced cervical cancer classification: enhancing pap smear images with hybrid PMD Filter-CLAHE

投稿日: 2025年6月19日作成者: jarxiv

要約子宮頸がんは、特に発展途上国では重大な健康問題のままです。効果的な治療に … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Pixel-level Certified Explanations via Randomized Smoothing

投稿日: 2025年6月19日作成者: jarxiv

要約事後帰属方法は、影響力のある入力ピクセルを強調することにより、深い学習予測 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Translation-Equivariance of Normalization Layers and Aliasing in Convolutional Neural Networks

投稿日: 2025年6月19日作成者: jarxiv

要約連続的な翻訳と正確に同等の畳み込み神経アーキテクチャの設計は、研究の積極的 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

NTIRE 2025 Image Shadow Removal Challenge Report

投稿日: 2025年6月19日作成者: jarxiv

要約この作業では、NTIRE 2025 Shadow Removal Chal … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

RefChartQA: Grounding Visual Answer on Chart Images through Instruction Tuning

Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation

Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation

Multimodal Large Language Models for Medical Report Generation via Customized Prompt Tuning

GenHOI: Generalizing Text-driven 4D Human-Object Interaction Synthesis for Unseen Objects

Unsourced Adversarial CAPTCHA: A Bi-Phase Adversarial CAPTCHA Framework

Advanced cervical cancer classification: enhancing pap smear images with hybrid PMD Filter-CLAHE

Pixel-level Certified Explanations via Randomized Smoothing

Translation-Equivariance of Normalization Layers and Aliasing in Convolutional Neural Networks

NTIRE 2025 Image Shadow Removal Challenge Report

最近の投稿

最近のコメント

アーカイブ

カテゴリー