「cs.CV」カテゴリーアーカイブ

Shallow Diffuse: Robust and Invisible Watermarking through Low-Dimensional Subspaces in Diffusion Models

投稿日: 2024年10月29日作成者: jarxiv

要約拡散モデルに基づいて AI によって生成されたコンテンツが広く使用されてい … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Attack-Resilient Image Watermarking Using Stable Diffusion

投稿日: 2024年10月29日作成者: jarxiv

要約画像に透かしを入れることは、画像の出所を追跡し、所有権を証明するために重要 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

LiGAR: LiDAR-Guided Hierarchical Transformer for Multi-Modal Group Activity Recognition

投稿日: 2024年10月29日作成者: jarxiv

要約グループアクティビティ認識 (GAR) は、マルチエージェントインタラ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LAMA: Stable Dual-Domain Deep Reconstruction For Sparse-View CT

投稿日: 2024年10月29日作成者: jarxiv

要約逆の問題は、多くのアプリケーション、特に断層撮影イメージングで発生します。 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.NA, math.NA | コメントを受け付けていません

Zero-Shot Action Recognition in Surveillance Videos

投稿日: 2024年10月29日作成者: jarxiv

要約公共空間での監視需要の高まりは、人的資源の不足により重大な課題を引き起こし … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Extrapolating Prospective Glaucoma Fundus Images through Diffusion Model in Irregular Longitudinal Sequences

投稿日: 2024年10月29日作成者: jarxiv

要約緑内障進行予測のための縦断的データセットの利用は、早期の治療介入をサポート … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation

投稿日: 2024年10月29日作成者: jarxiv

要約画像生成の分野では、追加のテキスト指示を使用して視覚的なプロンプトからカス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unique3D: High-Quality and Efficient 3D Mesh Generation from a Single Image

投稿日: 2024年10月29日作成者: jarxiv

要約この研究では、単一ビュー画像から高品質の 3D メッシュを効率的に生成する … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG, I.2.10 | コメントを受け付けていません

Enhancing Learned Image Compression via Cross Window-based Attention

投稿日: 2024年10月29日作成者: jarxiv

要約近年、学習された画像圧縮方法は、従来の画像圧縮方法と比較して優れたレート歪 … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

Synthetica: Large Scale Synthetic Data for Robot Perception

投稿日: 2024年10月29日作成者: jarxiv

要約ビジョンベースの物体検出器は、環境内の物体の位置特定に関する貴重な情報を提 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Shallow Diffuse: Robust and Invisible Watermarking through Low-Dimensional Subspaces in Diffusion Models

Attack-Resilient Image Watermarking Using Stable Diffusion

LiGAR: LiDAR-Guided Hierarchical Transformer for Multi-Modal Group Activity Recognition

LAMA: Stable Dual-Domain Deep Reconstruction For Sparse-View CT

Zero-Shot Action Recognition in Surveillance Videos

Extrapolating Prospective Glaucoma Fundus Images through Diffusion Model in Irregular Longitudinal Sequences

DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation

Unique3D: High-Quality and Efficient 3D Mesh Generation from a Single Image

Enhancing Learned Image Compression via Cross Window-based Attention

Synthetica: Large Scale Synthetic Data for Robot Perception

最近の投稿

最近のコメント

アーカイブ

カテゴリー