月別アーカイブ: 2024年4月

Improved Probabilistic Image-Text Representations

要約 基本的なビジョン言語 (VL) タスクである画像テキスト マッチング (I … 続きを読む

カテゴリー: cs.CV, cs.LG | Improved Probabilistic Image-Text Representations はコメントを受け付けていません

Learning Zero-Shot Material States Segmentation, by Implanting Natural Image Patterns in Synthetic Data

要約 物質とその状態を視覚的に理解してセグメント化することは、物理世界を理解する … 続きを読む

カテゴリー: cs.CV | Learning Zero-Shot Material States Segmentation, by Implanting Natural Image Patterns in Synthetic Data はコメントを受け付けていません

BlockFusion: Expandable 3D Scene Generation using Latent Tri-plane Extrapolation

要約 BlockFusion は、3D シーンを単位ブロックとして生成し、新しい … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | BlockFusion: Expandable 3D Scene Generation using Latent Tri-plane Extrapolation はコメントを受け付けていません

MultIOD: Rehearsal-free Multihead Incremental Object Detector

要約 クラス増分学習 (CIL) とは、ストリームに出現する新しいクラスを統合す … 続きを読む

カテゴリー: cs.CV | MultIOD: Rehearsal-free Multihead Incremental Object Detector はコメントを受け付けていません

Deepfake Generation and Detection: A Benchmark and Survey

要約 ディープフェイク生成の進歩に加えて、プライバシー侵害やフィッシング攻撃など … 続きを読む

カテゴリー: cs.CV | Deepfake Generation and Detection: A Benchmark and Survey はコメントを受け付けていません

One-Step Late Fusion Multi-view Clustering with Compressed Subspace

要約 後期融合マルチビュー クラスタリング (LMVC) は、その優れた計算速度 … 続きを読む

カテゴリー: cs.CV | One-Step Late Fusion Multi-view Clustering with Compressed Subspace はコメントを受け付けていません

Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis

要約 拡散モデルは画像生成への有望なアプローチであり、競争力のあるパフォーマンス … 続きを読む

カテゴリー: cs.CV | Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis はコメントを受け付けていません

Cross-Silo Federated Learning Across Divergent Domains with Iterative Parameter Alignment

要約 プライベート ソースに分散されたデータの集合的な知識から学習することで、強 … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.LG | Cross-Silo Federated Learning Across Divergent Domains with Iterative Parameter Alignment はコメントを受け付けていません

Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences

要約 2 つの画像が与えられた場合、画像間の対応関係を確立することで、それらの間 … 続きを読む

カテゴリー: cs.CV | Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences はコメントを受け付けていません

UltraLight VM-UNet: Parallel Vision Mamba Significantly Reduces Parameters for Skin Lesion Segmentation

要約 従来、モデルのセグメンテーションのパフォーマンスを向上させるために、ほとん … 続きを読む

カテゴリー: cs.CV, eess.IV | UltraLight VM-UNet: Parallel Vision Mamba Significantly Reduces Parameters for Skin Lesion Segmentation はコメントを受け付けていません