cs.CV」カテゴリーアーカイブ

MagicID: Flexible ID Fidelity Generation System

要約 ポートレート忠実度生成は、制御性と忠実度の両方を強化することに主に焦点を当 … 続きを読む

カテゴリー: cs.CV | MagicID: Flexible ID Fidelity Generation System はコメントを受け付けていません

A Grey-box Attack against Latent Diffusion Model-based Image Editing by Posterior Collapse

要約 生成 AI、特に潜在拡散モデル (LDM) の最近の進歩は、画像の合成と操 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Grey-box Attack against Latent Diffusion Model-based Image Editing by Posterior Collapse はコメントを受け付けていません

ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining

要約 3D ガウス スプラッティング (3DGS) は、多くの視覚タスクにおける … 続きを読む

カテゴリー: cs.CV | ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining はコメントを受け付けていません

Vision-Language Dataset Distillation

要約 データセット蒸留手法は、大規模なデータセットをより小さな合成データのセット … 続きを読む

カテゴリー: cs.CV | Vision-Language Dataset Distillation はコメントを受け付けていません

CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network

要約 近年、Wi-Fi センシングは、プライバシー保護、低コスト、浸透能力などの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network はコメントを受け付けていません

SDI-Net: Toward Sufficient Dual-View Interaction for Low-light Stereo Image Enhancement

要約 現在、ほとんどの低照度画像強調方法は単一ビューからの情報のみを考慮しており … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | SDI-Net: Toward Sufficient Dual-View Interaction for Low-light Stereo Image Enhancement はコメントを受け付けていません

Large Point-to-Gaussian Model for Image-to-3D Generation

要約 最近、画像から 3D へのアプローチにより、大規模な再構成モデ​​ル、特に … 続きを読む

カテゴリー: cs.CV | Large Point-to-Gaussian Model for Image-to-3D Generation はコメントを受け付けていません

A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection

要約 低ショットおよび少数ショットの物体検出のための現在の方法は、主に物体を検出 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.PF | A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection はコメントを受け付けていません

Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations

要約 自己教師あり表現学習では、多くの場合、データ拡張を使用して、データの「スタ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations はコメントを受け付けていません

HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments

要約 高解像度の視覚言語モデル (VLM) は、詳細な画像情報を保存することで精 … 続きを読む

カテゴリー: cs.AI, cs.CV | HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments はコメントを受け付けていません