月別アーカイブ: 2024年2月

HistoSegCap: Capsules for Weakly-Supervised Semantic Segmentation of Histological Tissue Type in Whole Slide Images

要約 デジタル病理学では、物理的な組織スライドを高解像度の全スライド画像 (WS … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | HistoSegCap: Capsules for Weakly-Supervised Semantic Segmentation of Histological Tissue Type in Whole Slide Images はコメントを受け付けていません

Control Color: Multimodal Diffusion-based Interactive Image Colorization

要約 多数の色付け方法が存在するにもかかわらず、ユーザー操作の欠如、局所的な色付 … 続きを読む

カテゴリー: cs.CV | Control Color: Multimodal Diffusion-based Interactive Image Colorization はコメントを受け付けていません

Multi-Model 3D Registration: Finding Multiple Moving Objects in Cluttered Point Clouds

要約 マルチモデル 3D レジストレーションと呼ばれる、3D レジストレーション … 続きを読む

カテゴリー: cs.CV, cs.RO | Multi-Model 3D Registration: Finding Multiple Moving Objects in Cluttered Point Clouds はコメントを受け付けていません

K-space Cold Diffusion: Learning to Reconstruct Accelerated MRI without Noise

要約 最近では、ディープラーニングベースの MRI 再構成モデ​​ルが優れたパフ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph | K-space Cold Diffusion: Learning to Reconstruct Accelerated MRI without Noise はコメントを受け付けていません

Universal Prompt Optimizer for Safe Text-to-Image Generation

要約 Text-to-Image (T2I) モデルは、テキスト プロンプトに基 … 続きを読む

カテゴリー: cs.CL, cs.CV | Universal Prompt Optimizer for Safe Text-to-Image Generation はコメントを受け付けていません

Multi-modal preference alignment remedies regression of visual instruction tuning on language model

要約 運用環境では、マルチモーダル大規模言語モデル (MLLM) は、画像とテキ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Multi-modal preference alignment remedies regression of visual instruction tuning on language model はコメントを受け付けていません

3D Diffuser Actor: Policy Diffusion with 3D Scene Representations

要約 私たちはロボット操作のための普及政策と 3D シーン表現を融合させます。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | 3D Diffuser Actor: Policy Diffusion with 3D Scene Representations はコメントを受け付けていません

Weak-Mamba-UNet: Visual Mamba Makes CNN and ViT Work Better for Scribble-based Medical Image Segmentation

要約 医療画像のセグメンテーションはディープラーニング技術への依存度が高まってい … 続きを読む

カテゴリー: cs.CV, eess.IV | Weak-Mamba-UNet: Visual Mamba Makes CNN and ViT Work Better for Scribble-based Medical Image Segmentation はコメントを受け付けていません

Fusion of Diffusion Weighted MRI and Clinical Data for Predicting Functional Outcome after Acute Ischemic Stroke with Deep Contrastive Learning

要約 脳卒中は、25 歳以上の成人人口の約 4 分の 1 が罹患している、一般的 … 続きを読む

カテゴリー: cs.CV, cs.LG | Fusion of Diffusion Weighted MRI and Clinical Data for Predicting Functional Outcome after Acute Ischemic Stroke with Deep Contrastive Learning はコメントを受け付けていません

PaLM2-VAdapter: Progressively Aligned Language Model Makes a Strong Vision-language Adapter

要約 この論文では、漸進的に調整された言語モデルがフリーズ ビジョン エンコーダ … 続きを読む

カテゴリー: cs.CV | PaLM2-VAdapter: Progressively Aligned Language Model Makes a Strong Vision-language Adapter はコメントを受け付けていません