月別アーカイブ: 2023年3月

Sketch-an-Anchor: Sub-epoch Fast Model Adaptation for Zero-shot Sketch-based Image Retrieval

要約 Sketch-an-Anchor は、エポックの下で最先端の Zero-s … 続きを読む

カテゴリー: cs.CV | Sketch-an-Anchor: Sub-epoch Fast Model Adaptation for Zero-shot Sketch-based Image Retrieval はコメントを受け付けていません

NEWTON: Neural View-Centric Mapping for On-the-Fly Large-Scale SLAM

要約 ニューラル フィールド ベースの 3D 表現は、SLAM システムを含む多 … 続きを読む

カテゴリー: cs.CV, cs.RO | NEWTON: Neural View-Centric Mapping for On-the-Fly Large-Scale SLAM はコメントを受け付けていません

Exploring Asymmetric Tunable Blind-Spots for Self-supervised Denoising in Real-World Scenarios

要約 自己教師ありノイズ除去は、きれいな画像なしでトレーニングできるため、広く注 … 続きを読む

カテゴリー: cs.CV | Exploring Asymmetric Tunable Blind-Spots for Self-supervised Denoising in Real-World Scenarios はコメントを受け付けていません

Does CLIP Bind Concepts? Probing Compositionality in Large Image Models

要約 テキストと画像を組み合わせた大規模なニューラル ネットワーク モデルは、近 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Does CLIP Bind Concepts? Probing Compositionality in Large Image Models はコメントを受け付けていません

Improving the Transferability of Adversarial Attacks on Face Recognition with Beneficial Perturbation Feature Augmentation

要約 顔認識 (FR) モデルは、無害な顔画像に知覚できない摂動を追加することに … 続きを読む

カテゴリー: cs.CV | Improving the Transferability of Adversarial Attacks on Face Recognition with Beneficial Perturbation Feature Augmentation はコメントを受け付けていません

Improving Transfer Learning with a Dual Image and Video Transformer for Multi-label Movie Trailer Genre Classification

要約 この論文では、ImageNet の空間表現と Kinetics の時空間表 … 続きを読む

カテゴリー: cs.CV, cs.LG | Improving Transfer Learning with a Dual Image and Video Transformer for Multi-label Movie Trailer Genre Classification はコメントを受け付けていません

Adaptive Superpixel for Active Learning in Semantic Segmentation

要約 セマンティック セグメンテーションの学習にはピクセル単位の注釈が必要ですが … 続きを読む

カテゴリー: cs.CV | Adaptive Superpixel for Active Learning in Semantic Segmentation はコメントを受け付けていません

BEVSimDet: Simulated Multi-modal Distillation in Bird’s-Eye View for Multi-view 3D Object Detection

要約 マルチビュー カメラ ベースの 3D オブジェクト検出は、その低コストによ … 続きを読む

カテゴリー: cs.CV | BEVSimDet: Simulated Multi-modal Distillation in Bird’s-Eye View for Multi-view 3D Object Detection はコメントを受け付けていません

A Residual Diffusion Model for High Perceptual Quality Codec Augmentation

要約 拡散確率モデルは、最近、高品質の画像およびビデオ データの生成において目覚 … 続きを読む

カテゴリー: cs.CV, eess.IV | A Residual Diffusion Model for High Perceptual Quality Codec Augmentation はコメントを受け付けていません

Selective experience replay compression using coresets for lifelong deep reinforcement learning in medical imaging

要約 選択的体験再生は、生涯学習と深層強化学習を統合するための一般的な戦略です。 … 続きを読む

カテゴリー: cs.CV, cs.LG | Selective experience replay compression using coresets for lifelong deep reinforcement learning in medical imaging はコメントを受け付けていません