「cs.CV」カテゴリーアーカイブ

MagicID: Flexible ID Fidelity Generation System

投稿日: 2024年8月21日作成者: jarxiv

要約ポートレート忠実度生成は、制御性と忠実度の両方を強化することに主に焦点を当 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Grey-box Attack against Latent Diffusion Model-based Image Editing by Posterior Collapse

投稿日: 2024年8月21日作成者: jarxiv

要約生成 AI、特に潜在拡散モデル (LDM) の最近の進歩は、画像の合成と操 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining

投稿日: 2024年8月21日作成者: jarxiv

要約 3D ガウススプラッティング (3DGS) は、多くの視覚タスクにおける … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Vision-Language Dataset Distillation

投稿日: 2024年8月21日作成者: jarxiv

要約データセット蒸留手法は、大規模なデータセットをより小さな合成データのセット … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network

投稿日: 2024年8月21日作成者: jarxiv

要約近年、Wi-Fi センシングは、プライバシー保護、低コスト、浸透能力などの … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | コメントを受け付けていません

SDI-Net: Toward Sufficient Dual-View Interaction for Low-light Stereo Image Enhancement

投稿日: 2024年8月21日作成者: jarxiv

要約現在、ほとんどの低照度画像強調方法は単一ビューからの情報のみを考慮しており … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Large Point-to-Gaussian Model for Image-to-3D Generation

投稿日: 2024年8月21日作成者: jarxiv

要約最近、画像から 3D へのアプローチにより、大規模な再構成モデル、特に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection

投稿日: 2024年8月21日作成者: jarxiv

要約低ショットおよび少数ショットの物体検出のための現在の方法は、主に物体を検出 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.PF | コメントを受け付けていません

Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations

投稿日: 2024年8月21日作成者: jarxiv

要約自己教師あり表現学習では、多くの場合、データ拡張を使用して、データの「スタ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントを受け付けていません

HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments

投稿日: 2024年8月21日作成者: jarxiv

要約高解像度の視覚言語モデル (VLM) は、詳細な画像情報を保存することで精 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

MagicID: Flexible ID Fidelity Generation System

A Grey-box Attack against Latent Diffusion Model-based Image Editing by Posterior Collapse

ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining

Vision-Language Dataset Distillation

CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network

SDI-Net: Toward Sufficient Dual-View Interaction for Low-light Stereo Image Enhancement

Large Point-to-Gaussian Model for Image-to-3D Generation

A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection

Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations

HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments

最近の投稿

最近のコメント

アーカイブ

カテゴリー