月別アーカイブ: 2023年6月

Vision Language Pre-training by Contrastive Learning with Cross-Modal Similarity Regulation

投稿日: 2023年6月23日作成者: jarxiv

要約ビジョンランゲージ事前トレーニング（VLP）におけるクロスモーダル対比学習 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Ladder Fine-tuning approach for SAM integrating complementary network

投稿日: 2023年6月23日作成者: jarxiv

要約最近、コンピュータービジョンの分野でさまざまなタスクを実証する基礎モデル … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Restoration of the JPEG Maximum Lossy Compressed Face Images with Hourglass Block based on Early Stopping Discriminator

投稿日: 2023年6月23日作成者: jarxiv

要約 JPEG画像を圧縮率の高い損失圧縮方式で圧縮すると、画像にブロッキング現象 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Blended-NeRF: Zero-Shot Object Generation and Blending in Existing Neural Radiance Fields

投稿日: 2023年6月23日作成者: jarxiv

要約 NeRF によって表される 3D シーン内のローカル領域または特定のオブジ … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

3D Reconstruction of Spherical Images based on Incremental Structure from Motion

投稿日: 2023年6月23日作成者: jarxiv

要約 3D 再構成は、現代の写真測量システムにおいてますます重要な役割を果たして … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Data-Driven but Privacy-Conscious: Pedestrian Dataset De-identification via Full-Body Person Synthesis

投稿日: 2023年6月23日作成者: jarxiv

要約データ駆動型テクノロジーソリューションの出現に伴い、データプライバシー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Denoising Diffusion Semantic Segmentation with Mask Prior Modeling

投稿日: 2023年6月23日作成者: jarxiv

要約セマンティックセグメンテーションの進化は、長い間、各ピクセルを分類するた … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DiffWA: Diffusion Models for Watermark Attack

投稿日: 2023年6月23日作成者: jarxiv

要約ディープニューラルネットワーク (DNN) の急速な発展に伴い、多くの … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

Learning Unseen Modality Interaction

投稿日: 2023年6月23日作成者: jarxiv

要約マルチモーダル学習では、クロスモーダル対応を学習するためのトレーニング中に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Super-Resolution of BVOC Emission Maps Via Domain Adaptation

投稿日: 2023年6月23日作成者: jarxiv

要約生物由来の揮発性有機化合物 (BVOC) 排出マップの解像度を向上させるこ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

月別アーカイブ: 2023年6月

Vision Language Pre-training by Contrastive Learning with Cross-Modal Similarity Regulation

Ladder Fine-tuning approach for SAM integrating complementary network

Restoration of the JPEG Maximum Lossy Compressed Face Images with Hourglass Block based on Early Stopping Discriminator

Blended-NeRF: Zero-Shot Object Generation and Blending in Existing Neural Radiance Fields

3D Reconstruction of Spherical Images based on Incremental Structure from Motion

Data-Driven but Privacy-Conscious: Pedestrian Dataset De-identification via Full-Body Person Synthesis

Denoising Diffusion Semantic Segmentation with Mask Prior Modeling

DiffWA: Diffusion Models for Watermark Attack

Learning Unseen Modality Interaction

Super-Resolution of BVOC Emission Maps Via Domain Adaptation

最近の投稿

最近のコメント

アーカイブ

カテゴリー