月別アーカイブ: 2024年2月

Video ReCap: Recursive Captioning of Hour-Long Videos

要約 ほとんどのビデオキャプションモデルは、数秒の短いビデオクリップを処理し、低 … 続きを読む

カテゴリー: cs.CV | Video ReCap: Recursive Captioning of Hour-Long Videos はコメントを受け付けていません

Probabilistic Bayesian optimal experimental design using conditional normalizing flows

要約 ベイズ最適実験計画 (OED) は、予算制約の下で最も有益な実験を実施し、 … 続きを読む

カテゴリー: cs.CV, cs.LG | Probabilistic Bayesian optimal experimental design using conditional normalizing flows はコメントを受け付けていません

LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping

要約 私たちは、特定のジェネレーターの顔交換潜在コードを生成する単純な顔交換フレ … 続きを読む

カテゴリー: cs.CV | LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping はコメントを受け付けていません

Controlling Vision-Language Models for Multi-Task Image Restoration

要約 CLIP などのビジョン言語モデルは、ゼロショットまたはラベルフリー予測の … 続きを読む

カテゴリー: cs.CV | Controlling Vision-Language Models for Multi-Task Image Restoration はコメントを受け付けていません

Objective and Interpretable Breast Cosmesis Evaluation with Attention Guided Denoising Diffusion Anomaly Detection Model

要約 乳がん治療分野の進歩が進むにつれて、患者の生活の質に大きな影響を与えるため … 続きを読む

カテゴリー: cs.AI, cs.CV | Objective and Interpretable Breast Cosmesis Evaluation with Attention Guided Denoising Diffusion Anomaly Detection Model はコメントを受け付けていません

SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation

要約 航空画像セグメンテーションは、地図の自動作成や森林伐採の追跡などのアプリケ … 続きを読む

カテゴリー: cs.CV, I.5.4 | SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation はコメントを受け付けていません

Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study

要約 コンピューター断層撮影 (CT) による肺気腫の確実な定量化は、さまざまな … 続きを読む

カテゴリー: cs.CV | Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study はコメントを受け付けていません

Rethinking Centered Kernel Alignment in Knowledge Distillation

要約 知識の蒸留は、大規模モデルと軽量モデルの間の表現の不一致を埋めるための非常 … 続きを読む

カテゴリー: cs.CV | Rethinking Centered Kernel Alignment in Knowledge Distillation はコメントを受け付けていません

A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation

要約 マルチメディア理解タスクでは、破損したサンプルが機械学習モデルに供給される … 続きを読む

カテゴリー: cs.CV | A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation はコメントを受け付けていません

A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models

要約 Large Vision Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models はコメントを受け付けていません