月別アーカイブ: 2023年2月

Unified Chest X-ray and Radiology Report Generation Model with Multi-view Chest X-rays

要約 医学研究で生成された合成データは、プライバシーとセキュリティに敏感なデータ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Unified Chest X-ray and Radiology Report Generation Model with Multi-view Chest X-rays はコメントを受け付けていません

RSFDM-Net: Real-time Spatial and Frequency Domains Modulation Network for Underwater Image Enhancement

要約 水中の画像は通常、浮遊粒子による光の吸収と散乱によって引き起こされる明るさ … 続きを読む

カテゴリー: cs.CV, eess.IV | RSFDM-Net: Real-time Spatial and Frequency Domains Modulation Network for Underwater Image Enhancement はコメントを受け付けていません

HL Dataset: Grounding High-Level Linguistic Concepts in Vision

要約 現在のキャプション データセットは、オブジェクト中心のキャプションに焦点を … 続きを読む

カテゴリー: cs.CL, cs.CV | HL Dataset: Grounding High-Level Linguistic Concepts in Vision はコメントを受け付けていません

Aligning Text-to-Image Models using Human Feedback

要約 深い生成モデルは、テキストから画像への合成において印象的な結果を示していま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Aligning Text-to-Image Models using Human Feedback はコメントを受け付けていません

SoftCTC — Semi-Supervised Learning for Text Recognition using Soft Pseudo-Labels

要約 このホワイト ペーパーでは、光学式文字認識や自動音声認識などのシーケンス … 続きを読む

カテゴリー: 68T07, 68T10, cs.CV, cs.LG | SoftCTC — Semi-Supervised Learning for Text Recognition using Soft Pseudo-Labels はコメントを受け付けていません

medigan: a Python library of pretrained generative models for medical image synthesis

要約 生成モデルによって生成された合成データは、医療画像処理におけるデータを大量 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, I.2.0 | medigan: a Python library of pretrained generative models for medical image synthesis はコメントを受け付けていません

Designing an Encoder for Fast Personalization of Text-to-Image Models

要約 テキストから画像へのパーソナライゼーションは、事前にトレーニングされた拡散 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Designing an Encoder for Fast Personalization of Text-to-Image Models はコメントを受け付けていません

DiffusioNeRF: Regularizing Neural Radiance Fields with Denoising Diffusion Models

要約 良好な条件下では、ニューラル ラディアンス フィールド (NeRF) は、 … 続きを読む

カテゴリー: cs.CV | DiffusioNeRF: Regularizing Neural Radiance Fields with Denoising Diffusion Models はコメントを受け付けていません

Learning Neural Volumetric Representations of Dynamic Humans in Minutes

要約 この論文では、まばらなマルチビュー ビデオから動的な人間の自由視点ビデオを … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Learning Neural Volumetric Representations of Dynamic Humans in Minutes はコメントを受け付けていません

Side Adapter Network for Open-Vocabulary Semantic Segmentation

要約 このホワイト ペーパーでは、Side Adapter Network (S … 続きを読む

カテゴリー: cs.AI, cs.CV | Side Adapter Network for Open-Vocabulary Semantic Segmentation はコメントを受け付けていません