cs.CV」カテゴリーアーカイブ

Sublinear Variational Optimization of Gaussian Mixture Models with Millions to Billions of Parameters

要約 ガウス混合モデル (GMM) は、最も頻繁に使用される機械学習モデルの 1 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Sublinear Variational Optimization of Gaussian Mixture Models with Millions to Billions of Parameters はコメントを受け付けていません

LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models

要約 潜在拡散モデル (LDM) の進歩により、高解像度画像生成は革命を起こしま … 続きを読む

カテゴリー: cs.CV, cs.LG | LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models はコメントを受け付けていません

BlanketGen2-Fit3D: Synthetic Blanket Augmentation Towards Improving Real-World In-Bed Blanket Occluded Human Pose Estimation

要約 単眼 RGB 画像からの人間の姿勢推定 (HPE) は、臨床ベッド内での骨 … 続きを読む

カテゴリー: cs.CV, I.2.10 | BlanketGen2-Fit3D: Synthetic Blanket Augmentation Towards Improving Real-World In-Bed Blanket Occluded Human Pose Estimation はコメントを受け付けていません

Metric for Evaluating Performance of Reference-Free Demorphing Methods

要約 顔モーフは、2 つ (またはそれ以上) の異なるアイデンティティに関連する … 続きを読む

カテゴリー: cs.CV | Metric for Evaluating Performance of Reference-Free Demorphing Methods はコメントを受け付けていません

Deep Learning Based Segmentation of Blood Vessels from H&E Stained Oesophageal Adenocarcinoma Whole-Slide Images

要約 血管(BV)は腫瘍微小環境(TME)において重要な役割を果たしており、がん … 続きを読む

カテゴリー: cs.CV, eess.IV | Deep Learning Based Segmentation of Blood Vessels from H&E Stained Oesophageal Adenocarcinoma Whole-Slide Images はコメントを受け付けていません

Let There Be Light: Robust Lensless Imaging Under External Illumination With Deep Learning

要約 レンズレスカメラは、画像形成をアナログ光学からデジタル後処理に移行すること … 続きを読む

カテゴリー: cs.CV, eess.IV | Let There Be Light: Robust Lensless Imaging Under External Illumination With Deep Learning はコメントを受け付けていません

UI-TARS: Pioneering Automated GUI Interaction with Native Agents

要約 このペーパーでは、スクリーンショットを入力としてのみ認識し、人間のような対 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | UI-TARS: Pioneering Automated GUI Interaction with Native Agents はコメントを受け付けていません

VARGPT: Unified Understanding and Generation in a Visual Autoregressive Multimodal Large Language Model

要約 単一の自己回帰フレームワーク内で視覚的な理解と生成を統合する、新しいマルチ … 続きを読む

カテゴリー: cs.CV | VARGPT: Unified Understanding and Generation in a Visual Autoregressive Multimodal Large Language Model はコメントを受け付けていません

Cinepro: Robust Training of Foundation Models for Cancer Detection in Prostate Ultrasound Cineloops

要約 深層学習 (DL) モデルを使用した前立腺がん (PCa) 検出は、生検中 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, q-bio.TO | Cinepro: Robust Training of Foundation Models for Cancer Detection in Prostate Ultrasound Cineloops はコメントを受け付けていません

Vision-Language Models for Automated Chest X-ray Interpretation: Leveraging ViT and GPT-2

要約 放射線医学は、その非侵襲的な診断能力により、現代医学において極めて重要な役 … 続きを読む

カテゴリー: cs.CV | Vision-Language Models for Automated Chest X-ray Interpretation: Leveraging ViT and GPT-2 はコメントを受け付けていません