月別アーカイブ: 2024年4月

InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation

要約 チューニングフリーの拡散に基づくモデルは、画像のパーソナライゼーションとカ … 続きを読む

カテゴリー: cs.CV | InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation はコメントを受け付けていません

Adaptive Affinity-Based Generalization For MRI Imaging Segmentation Across Resource-Limited Settings

要約 医療画像セグメンテーションのための多様なデータソースの共同利用は、データの … 続きを読む

カテゴリー: cs.CV | Adaptive Affinity-Based Generalization For MRI Imaging Segmentation Across Resource-Limited Settings はコメントを受け付けていません

LiDAR4D: Dynamic Neural Fields for Novel Space-time View LiDAR Synthesis

要約 ニューラル放射輝度場(NeRF)は、画像の新規ビュー合成(NVS)において … 続きを読む

カテゴリー: cs.CV | LiDAR4D: Dynamic Neural Fields for Novel Space-time View LiDAR Synthesis はコメントを受け付けていません

Evaluating GPT-4 with Vision on Detection of Radiological Findings on Chest Radiographs

要約 この研究では、視覚認識を備えたマルチモーダル大規模言語モデルGPT-4Vの … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Evaluating GPT-4 with Vision on Detection of Radiological Findings on Chest Radiographs はコメントを受け付けていません

Cross-Attention Makes Inference Cumbersome in Text-to-Image Diffusion Models

要約 本研究では、テキスト条件付き拡散モデルにおける推論中の交差注意の役割を探る … 続きを読む

カテゴリー: cs.CV | Cross-Attention Makes Inference Cumbersome in Text-to-Image Diffusion Models はコメントを受け付けていません

DIBS: Enhancing Dense Video Captioning with Unlabeled Videos via Pseudo Boundary Enrichment and Online Refinement

要約 本稿では、ラベル付けされていない動画から生成されるイベントキャプションとそ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | DIBS: Enhancing Dense Video Captioning with Unlabeled Videos via Pseudo Boundary Enrichment and Online Refinement はコメントを受け付けていません

Unsupervised Occupancy Learning from Sparse Point Cloud

要約 暗黙的な神経表現は、3D形状から画像や音声まで幅広い複雑なデータモダリティ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Unsupervised Occupancy Learning from Sparse Point Cloud はコメントを受け付けていません

Learnable Weight Initialization for Volumetric Medical Image Segmentation

要約 局所畳み込みと大域的注目の利点を組み合わせたハイブリッドボリューメトリック … 続きを読む

カテゴリー: cs.CV, eess.IV | Learnable Weight Initialization for Volumetric Medical Image Segmentation はコメントを受け付けていません

Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation

要約 単眼での奥行き推定は、コンピュータビジョンの基本的なタスクである。単一画像 … 続きを読む

カテゴリー: cs.CV | Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation はコメントを受け付けていません

DriftRec: Adapting diffusion models to blind JPEG restoration

要約 この研究では、拡散モデルの忠実度の高い生成能力を利用して、高圧縮レベルでの … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | DriftRec: Adapting diffusion models to blind JPEG restoration はコメントを受け付けていません