月別アーカイブ: 2023年6月

Vision Language Pre-training by Contrastive Learning with Cross-Modal Similarity Regulation

要約 ビジョンランゲージ事前トレーニング(VLP)におけるクロスモーダル対比学習 … 続きを読む

カテゴリー: cs.AI, cs.CV | Vision Language Pre-training by Contrastive Learning with Cross-Modal Similarity Regulation はコメントを受け付けていません

Ladder Fine-tuning approach for SAM integrating complementary network

要約 最近、コンピューター ビジョンの分野でさまざまなタスクを実証する基礎モデル … 続きを読む

カテゴリー: cs.CV | Ladder Fine-tuning approach for SAM integrating complementary network はコメントを受け付けていません

Restoration of the JPEG Maximum Lossy Compressed Face Images with Hourglass Block based on Early Stopping Discriminator

要約 JPEG画像を圧縮率の高い損失圧縮方式で圧縮すると、画像にブロッキング現象 … 続きを読む

カテゴリー: cs.CV, eess.IV | Restoration of the JPEG Maximum Lossy Compressed Face Images with Hourglass Block based on Early Stopping Discriminator はコメントを受け付けていません

Blended-NeRF: Zero-Shot Object Generation and Blending in Existing Neural Radiance Fields

要約 NeRF によって表される 3D シーン内のローカル領域または特定のオブジ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Blended-NeRF: Zero-Shot Object Generation and Blending in Existing Neural Radiance Fields はコメントを受け付けていません

3D Reconstruction of Spherical Images based on Incremental Structure from Motion

要約 3D 再構成は、現代の写真測量システムにおいてますます重要な役割を果たして … 続きを読む

カテゴリー: cs.CV | 3D Reconstruction of Spherical Images based on Incremental Structure from Motion はコメントを受け付けていません

Data-Driven but Privacy-Conscious: Pedestrian Dataset De-identification via Full-Body Person Synthesis

要約 データ駆動型テクノロジー ソリューションの出現に伴い、データ プライバシー … 続きを読む

カテゴリー: cs.CV | Data-Driven but Privacy-Conscious: Pedestrian Dataset De-identification via Full-Body Person Synthesis はコメントを受け付けていません

Denoising Diffusion Semantic Segmentation with Mask Prior Modeling

要約 セマンティック セグメンテーションの進化は、長い間、各ピクセルを分類するた … 続きを読む

カテゴリー: cs.AI, cs.CV | Denoising Diffusion Semantic Segmentation with Mask Prior Modeling はコメントを受け付けていません

DiffWA: Diffusion Models for Watermark Attack

要約 ディープ ニューラル ネットワーク (DNN) の急速な発展に伴い、多くの … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | DiffWA: Diffusion Models for Watermark Attack はコメントを受け付けていません

Learning Unseen Modality Interaction

要約 マルチモーダル学習では、クロスモーダル対応を学習するためのトレーニング中に … 続きを読む

カテゴリー: cs.CV | Learning Unseen Modality Interaction はコメントを受け付けていません

Super-Resolution of BVOC Emission Maps Via Domain Adaptation

要約 生物由来の揮発性有機化合物 (BVOC) 排出マップの解像度を向上させるこ … 続きを読む

カテゴリー: cs.CV, eess.IV | Super-Resolution of BVOC Emission Maps Via Domain Adaptation はコメントを受け付けていません