月別アーカイブ: 2024年4月

Improved Probabilistic Image-Text Representations

投稿日: 2024年4月10日作成者: jarxiv

要約基本的なビジョン言語 (VL) タスクである画像テキストマッチング (I … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Learning Zero-Shot Material States Segmentation, by Implanting Natural Image Patterns in Synthetic Data

投稿日: 2024年4月10日作成者: jarxiv

要約物質とその状態を視覚的に理解してセグメント化することは、物理世界を理解する … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

BlockFusion: Expandable 3D Scene Generation using Latent Tri-plane Extrapolation

投稿日: 2024年4月10日作成者: jarxiv

要約 BlockFusion は、3D シーンを単位ブロックとして生成し、新しい … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

MultIOD: Rehearsal-free Multihead Incremental Object Detector

投稿日: 2024年4月10日作成者: jarxiv

要約クラス増分学習 (CIL) とは、ストリームに出現する新しいクラスを統合す … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deepfake Generation and Detection: A Benchmark and Survey

投稿日: 2024年4月10日作成者: jarxiv

要約ディープフェイク生成の進歩に加えて、プライバシー侵害やフィッシング攻撃など … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

One-Step Late Fusion Multi-view Clustering with Compressed Subspace

投稿日: 2024年4月10日作成者: jarxiv

要約後期融合マルチビュークラスタリング (LMVC) は、その優れた計算速度 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis

投稿日: 2024年4月10日作成者: jarxiv

要約拡散モデルは画像生成への有望なアプローチであり、競争力のあるパフォーマンス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cross-Silo Federated Learning Across Divergent Domains with Iterative Parameter Alignment

投稿日: 2024年4月10日作成者: jarxiv

要約プライベートソースに分散されたデータの集合的な知識から学習することで、強 … 続きを読む →

カテゴリー: cs.CV, cs.DC, cs.LG | コメントを受け付けていません

Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences

投稿日: 2024年4月10日作成者: jarxiv

要約 2 つの画像が与えられた場合、画像間の対応関係を確立することで、それらの間 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UltraLight VM-UNet: Parallel Vision Mamba Significantly Reduces Parameters for Skin Lesion Segmentation

投稿日: 2024年4月10日作成者: jarxiv

要約従来、モデルのセグメンテーションのパフォーマンスを向上させるために、ほとん … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

月別アーカイブ: 2024年4月

Improved Probabilistic Image-Text Representations

Learning Zero-Shot Material States Segmentation, by Implanting Natural Image Patterns in Synthetic Data

BlockFusion: Expandable 3D Scene Generation using Latent Tri-plane Extrapolation

MultIOD: Rehearsal-free Multihead Incremental Object Detector

Deepfake Generation and Detection: A Benchmark and Survey

One-Step Late Fusion Multi-view Clustering with Compressed Subspace

Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis

Cross-Silo Federated Learning Across Divergent Domains with Iterative Parameter Alignment

Matching 2D Images in 3D: Metric Relative Pose from Metric Correspondences

UltraLight VM-UNet: Parallel Vision Mamba Significantly Reduces Parameters for Skin Lesion Segmentation

最近の投稿

最近のコメント

アーカイブ

カテゴリー