月別アーカイブ: 2024年1月

Energy-Calibrated VAE with Test Time Free Lunch

要約 この論文では、変分オートエンコーダ (VAE) を強化するために条件付きエ … 続きを読む

カテゴリー: cs.CV | Energy-Calibrated VAE with Test Time Free Lunch はコメントを受け付けていません

Learning Explicit Contact for Implicit Reconstruction of Hand-held Objects from Monocular Images

要約 単眼の RGB 画像から手持ちのオブジェクトを再構成することは、魅力的では … 続きを読む

カテゴリー: cs.CV, cs.GR | Learning Explicit Contact for Implicit Reconstruction of Hand-held Objects from Monocular Images はコメントを受け付けていません

End-to-End Optimized Image Compression with the Frequency-Oriented Transform

要約 画像圧縮は、情報爆発の時代の中で重要な課題となっています。 深層学習手法を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | End-to-End Optimized Image Compression with the Frequency-Oriented Transform はコメントを受け付けていません

ZeroShape: Regression-based Zero-shot Shape Reconstruction

要約 単一画像のゼロショット 3D 形状再構成の問題を研究します。 最近の研究で … 続きを読む

カテゴリー: cs.CV | ZeroShape: Regression-based Zero-shot Shape Reconstruction はコメントを受け付けていません

Adaptive Confidence Multi-View Hashing for Multimedia Retrieval

要約 マルチビュー ハッシュ法は、複数のビューからの異種データをバイナリ ハッシ … 続きを読む

カテゴリー: cs.CV | Adaptive Confidence Multi-View Hashing for Multimedia Retrieval はコメントを受け付けていません

FUSC: Fetal Ultrasound Semantic Clustering of Second Trimester Scans Using Deep Self-supervised Learning

要約 超音波は、妊娠中の臨床現場での主要な画像診断手段です。 毎年 1 億 4, … 続きを読む

カテゴリー: cs.CV | FUSC: Fetal Ultrasound Semantic Clustering of Second Trimester Scans Using Deep Self-supervised Learning はコメントを受け付けていません

Transcending the Limit of Local Window: Advanced Super-Resolution Transformer with Adaptive Token Dictionary

要約 単一画像超解像度は、低解像度 (LR) 画像から高解像度 (HR) 画像を … 続きを読む

カテゴリー: cs.CV | Transcending the Limit of Local Window: Advanced Super-Resolution Transformer with Adaptive Token Dictionary はコメントを受け付けていません

ModelNet-O: A Large-Scale Synthetic Dataset for Occlusion-Aware Point Cloud Classification

要約 最近、3D 点群分類は多くのデータセットの助けを借りて大幅に進歩しました。 … 続きを読む

カテゴリー: cs.CV | ModelNet-O: A Large-Scale Synthetic Dataset for Occlusion-Aware Point Cloud Classification はコメントを受け付けていません

Human vs. LMMs: Exploring the Discrepancy in Emoji Interpretation and Usage in Digital Communication

要約 大規模マルチモーダル モデル (LMM) を活用して、特にソーシャル メデ … 続きを読む

カテゴリー: cs.CV | Human vs. LMMs: Exploring the Discrepancy in Emoji Interpretation and Usage in Digital Communication はコメントを受け付けていません

DomainStudio: Fine-Tuning Diffusion Models for Domain-Driven Image Generation using Limited Data

要約 ノイズ除去拡散確率モデル (DDPM) は、大量のデータでトレーニングする … 続きを読む

カテゴリー: cs.CV | DomainStudio: Fine-Tuning Diffusion Models for Domain-Driven Image Generation using Limited Data はコメントを受け付けていません