月別アーカイブ: 2024年3月

DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations

要約 拡散ベースのテキストから画像へのモデルは、参照スタイルの転送において計り知 … 続きを読む

カテゴリー: cs.CV | DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations はコメントを受け付けていません

SELMA: Learning and Merging Skill-Specific Text-to-Image Experts with Auto-Generated Data

要約 最近の text-to-image (T2I) 生成モデルは、テキストの説 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | SELMA: Learning and Merging Skill-Specific Text-to-Image Experts with Auto-Generated Data はコメントを受け付けていません

Optimizing Latent Graph Representations of Surgical Scenes for Zero-Shot Domain Transfer

要約 目的: 深層学習の進歩により、手術ビデオ分析のための効果的なモデルが誕生し … 続きを読む

カテゴリー: cs.CV | Optimizing Latent Graph Representations of Surgical Scenes for Zero-Shot Domain Transfer はコメントを受け付けていません

Explainable Transformer Prototypes for Medical Diagnoses

要約 医療診断における人工知能の導入には、精度と有効性だけでなく信頼性も要求され … 続きを読む

カテゴリー: cs.CV | Explainable Transformer Prototypes for Medical Diagnoses はコメントを受け付けていません

Anatomically-Controllable Medical Image Generation with Segmentation-Guided Diffusion Models

要約 拡散モデルにより、非常に高品質な医用画像の生成が可能になりましたが、生成さ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | Anatomically-Controllable Medical Image Generation with Segmentation-Guided Diffusion Models はコメントを受け付けていません

Bayesian Diffusion Models for 3D Shape Reconstruction

要約 ベイジアン拡散モデル (BDM) は、統合拡散プロセスを介してトップダウン … 続きを読む

カテゴリー: cs.CV, cs.LG | Bayesian Diffusion Models for 3D Shape Reconstruction はコメントを受け付けていません

Memory-based Adapters for Online 3D Scene Perception

要約 この論文では、オンライン 3D シーン認識のための新しいフレームワークを提 … 続きを読む

カテゴリー: cs.CV | Memory-based Adapters for Online 3D Scene Perception はコメントを受け付けていません

BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion

要約 破損した画像を復元するプロセスである画像修復は、拡散モデル (DM) の出 … 続きを読む

カテゴリー: cs.CV | BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion はコメントを受け付けていません

VideoMamba: State Space Model for Efficient Video Understanding

要約 ビデオ理解におけるローカル冗長性とグローバル依存性という 2 つの課題に対 … 続きを読む

カテゴリー: cs.CV | VideoMamba: State Space Model for Efficient Video Understanding はコメントを受け付けていません

Attention Prompt Tuning: Parameter-efficient Adaptation of Pre-trained Models for Spatiotemporal Modeling

要約 このペーパーでは、アクション認識などのビデオベースのアプリケーション向けの … 続きを読む

カテゴリー: cs.CV | Attention Prompt Tuning: Parameter-efficient Adaptation of Pre-trained Models for Spatiotemporal Modeling はコメントを受け付けていません