cs.CV」カテゴリーアーカイブ

D$^2$-DPM: Dual Denoising for Quantized Diffusion Probabilistic Models

要約 拡散モデルは画像生成において最先端のパフォーマンスを実現しました。 ただし … 続きを読む

カテゴリー: cs.CV, cs.LG | D$^2$-DPM: Dual Denoising for Quantized Diffusion Probabilistic Models はコメントを受け付けていません

CG-MER: A Card Game-based Multimodal dataset for Emotion Recognition

要約 アフェクティブ コンピューティングの分野では、感情と新興テクノロジーの関係 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | CG-MER: A Card Game-based Multimodal dataset for Emotion Recognition はコメントを受け付けていません

A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation

要約 最近の基礎モデルにより、単眼の深さ推定において大きな進歩が可能になりました … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation はコメントを受け付けていません

Self-supervised Deep Hyperspectral Inpainting with the Plug and Play and Deep Image Prior Models

要約 ハイパースペクトル画像は通常、何百もの狭く連続したスペクトル帯域で構成され … 続きを読む

カテゴリー: cs.CV, cs.LG | Self-supervised Deep Hyperspectral Inpainting with the Plug and Play and Deep Image Prior Models はコメントを受け付けていません

EmoNeXt: an Adapted ConvNeXt for Facial Emotion Recognition

要約 顔の表情は人間のコミュニケーションにおいて重要な役割を果たしており、さまざ … 続きを読む

カテゴリー: cs.AI, cs.CV | EmoNeXt: an Adapted ConvNeXt for Facial Emotion Recognition はコメントを受け付けていません

Relaxed Rotational Equivariance via $G$-Biases in Vision

要約 Group Equivariant Convolution (GConv) … 続きを読む

カテゴリー: cs.AI, cs.CV | Relaxed Rotational Equivariance via $G$-Biases in Vision はコメントを受け付けていません

FramePainter: Endowing Interactive Image Editing with Video Diffusion Priors

要約 インタラクティブな画像編集により、ユーザーは描画、クリック、ドラッグなどの … 続きを読む

カテゴリー: cs.CV | FramePainter: Endowing Interactive Image Editing with Video Diffusion Priors はコメントを受け付けていません

Efficient Deep Learning-based Forward Solvers for Brain Tumor Growth Models

要約 膠芽腫は進行性の高い脳腫瘍であり、その予後不良と高い罹患率により大きな課題 … 続きを読む

カテゴリー: cs.CV, cs.LG | Efficient Deep Learning-based Forward Solvers for Brain Tumor Growth Models はコメントを受け付けていません

Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval

要約 テキストから画像への人物検索 (TIPR) の目的は、指定されたテキストの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval はコメントを受け付けていません

A Comprehensive Survey of Foundation Models in Medicine

要約 基礎モデル (FM) は、大規模なデータセットと自己教師あり学習手法を使用 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Comprehensive Survey of Foundation Models in Medicine はコメントを受け付けていません