月別アーカイブ: 2024年2月

Scene Prior Filtering for Depth Map Super-Resolution

要約 マルチモーダル融合は、深度画像の超解像を成功させるために不可欠です。 ただ … 続きを読む

カテゴリー: cs.CV | Scene Prior Filtering for Depth Map Super-Resolution はコメントを受け付けていません

MDTv2: Masked Diffusion Transformer is a Strong Image Synthesizer

要約 画像合成では成功しているにもかかわらず、拡散確率モデル (DPM) には画 … 続きを読む

カテゴリー: cs.CV | MDTv2: Masked Diffusion Transformer is a Strong Image Synthesizer はコメントを受け付けていません

The Effect of Intrinsic Dataset Properties on Generalization: Unraveling Learning Differences Between Natural and Medical Images

要約 この論文では、ニューラル ネットワークがさまざまな画像ドメインから学習する … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | The Effect of Intrinsic Dataset Properties on Generalization: Unraveling Learning Differences Between Natural and Medical Images はコメントを受け付けていません

VitalLens: Take A Vital Selfie

要約 本レポートでは、自撮り動画から心拍数や呼吸数などのバイタルサインをリアルタ … 続きを読む

カテゴリー: cs.CV, cs.HC | VitalLens: Take A Vital Selfie はコメントを受け付けていません

Drive&Segment: Unsupervised Semantic Segmentation of Urban Scenes via Cross-modal Distillation

要約 この研究では、カメラと LiDAR センサーを搭載して街中を走行する車によ … 続きを読む

カテゴリー: cs.CV | Drive&Segment: Unsupervised Semantic Segmentation of Urban Scenes via Cross-modal Distillation はコメントを受け付けていません

BenchCloudVision: A Benchmark Analysis of Deep Learning Approaches for Cloud Detection and Segmentation in Remote Sensing Imagery

要約 光学センサーを備えた衛星は高解像度の画像を取得し、さまざまな環境現象につい … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | BenchCloudVision: A Benchmark Analysis of Deep Learning Approaches for Cloud Detection and Segmentation in Remote Sensing Imagery はコメントを受け付けていません

Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification

要約 病理組織画像における乳がんの自動分類は、正確な診断と治療計画を立てるために … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification はコメントを受け付けていません

SDXL-Lightning: Progressive Adversarial Diffusion Distillation

要約 我々は、SDXL に基づいた 1 ステップ/数ステップの 1024px テ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SDXL-Lightning: Progressive Adversarial Diffusion Distillation はコメントを受け付けていません

MeMOTR: Long-Term Memory-Augmented Transformer for Multi-Object Tracking

要約 ビデオタスクとして、複数オブジェクト追跡 (MOT) はターゲットの時間情 … 続きを読む

カテゴリー: cs.CV | MeMOTR: Long-Term Memory-Augmented Transformer for Multi-Object Tracking はコメントを受け付けていません

Retrieval-Enhanced Contrastive Vision-Text Models

要約 CLIP などの対照的な画像テキスト モデルは、多くの最先端システムの構成 … 続きを読む

カテゴリー: cs.CV | Retrieval-Enhanced Contrastive Vision-Text Models はコメントを受け付けていません