月別アーカイブ: 2024年2月

Video ReCap: Recursive Captioning of Hour-Long Videos

投稿日: 2024年2月29日作成者: jarxiv

要約ほとんどのビデオキャプションモデルは、数秒の短いビデオクリップを処理し、低 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Probabilistic Bayesian optimal experimental design using conditional normalizing flows

投稿日: 2024年2月29日作成者: jarxiv

要約ベイズ最適実験計画 (OED) は、予算制約の下で最も有益な実験を実施し、 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping

投稿日: 2024年2月29日作成者: jarxiv

要約私たちは、特定のジェネレーターの顔交換潜在コードを生成する単純な顔交換フレ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Controlling Vision-Language Models for Multi-Task Image Restoration

投稿日: 2024年2月29日作成者: jarxiv

要約 CLIP などのビジョン言語モデルは、ゼロショットまたはラベルフリー予測の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Objective and Interpretable Breast Cosmesis Evaluation with Attention Guided Denoising Diffusion Anomaly Detection Model

投稿日: 2024年2月29日作成者: jarxiv

要約乳がん治療分野の進歩が進むにつれて、患者の生活の質に大きな影響を与えるため … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation

投稿日: 2024年2月29日作成者: jarxiv

要約航空画像セグメンテーションは、地図の自動作成や森林伐採の追跡などのアプリケ … 続きを読む →

カテゴリー: cs.CV, I.5.4 | コメントを受け付けていません

Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study

投稿日: 2024年2月29日作成者: jarxiv

要約コンピューター断層撮影 (CT) による肺気腫の確実な定量化は、さまざまな … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Rethinking Centered Kernel Alignment in Knowledge Distillation

投稿日: 2024年2月29日作成者: jarxiv

要約知識の蒸留は、大規模モデルと軽量モデルの間の表現の不一致を埋めるための非常 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation

投稿日: 2024年2月29日作成者: jarxiv

要約マルチメディア理解タスクでは、破損したサンプルが機械学習モデルに供給される … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models

投稿日: 2024年2月29日作成者: jarxiv

要約 Large Vision Language Model (LVLM) は、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年2月

Video ReCap: Recursive Captioning of Hour-Long Videos

Probabilistic Bayesian optimal experimental design using conditional normalizing flows

LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping

Controlling Vision-Language Models for Multi-Task Image Restoration

Objective and Interpretable Breast Cosmesis Evaluation with Attention Guided Denoising Diffusion Anomaly Detection Model

SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation

Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study

Rethinking Centered Kernel Alignment in Knowledge Distillation

A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation

A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー