月別アーカイブ: 2024年7月

SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks

要約 セマンティック セグメンテーションにおける最先端の手法の効率を向上させるに … 続きを読む

カテゴリー: cs.AI, cs.CV | SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks はコメントを受け付けていません

Greedy-DiM: Greedy Algorithms for Unreasonably Effective Face Morphs

要約 モーフィング攻撃は、複数の ID の生体情報を含む 1 つの画像を作成する … 続きを読む

カテゴリー: cs.AI, cs.CV | Greedy-DiM: Greedy Algorithms for Unreasonably Effective Face Morphs はコメントを受け付けていません

StructLDM: Structured Latent Diffusion for 3D Human Generation

要約 最近の 3D 人体生成モデルは、2D 画像から 3D 対応の GAN を学 … 続きを読む

カテゴリー: cs.CV | StructLDM: Structured Latent Diffusion for 3D Human Generation はコメントを受け付けていません

OpenSlot: Mixed Open-set Recognition with Object-centric Learning

要約 既存のオープンセット認識 (OSR) 研究では通常、各画像にはクラス ラベ … 続きを読む

カテゴリー: cs.CV | OpenSlot: Mixed Open-set Recognition with Object-centric Learning はコメントを受け付けていません

Real HSI-MSI-PAN image dataset for the hyperspectral/multi-spectral/panchromatic image fusion and super-resolution fields

要約 現在、ハイパースペクトル画像 (HSI) 融合実験のほとんどは、異なる融合 … 続きを読む

カテゴリー: cs.CV, eess.IV | Real HSI-MSI-PAN image dataset for the hyperspectral/multi-spectral/panchromatic image fusion and super-resolution fields はコメントを受け付けていません

SafaRi:Adaptive Sequence Transformer for Weakly Supervised Referring Expression Segmentation

要約 参照表現セグメンテーション (RES) は、テキストによって参照される画像 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | SafaRi:Adaptive Sequence Transformer for Weakly Supervised Referring Expression Segmentation はコメントを受け付けていません

SINCERE: Supervised Information Noise-Contrastive Estimation REvisited

要約 情報ノイズ対比推定 (InfoNCE) 損失関数は、その強力な経験的結果と … 続きを読む

カテゴリー: cs.CV, cs.LG | SINCERE: Supervised Information Noise-Contrastive Estimation REvisited はコメントを受け付けていません

Forward Learning for Gradient-based Black-box Saliency Map Generation

要約 勾配ベースの顕著性マップは、ディープ ニューラル ネットワークの決定を説明 … 続きを読む

カテゴリー: cs.AI, cs.CV | Forward Learning for Gradient-based Black-box Saliency Map Generation はコメントを受け付けていません

TokenPacker: Efficient Visual Projector for Multimodal LLM

要約 ビジュアル プロジェクターは、マルチモーダル LLM (MLLM) におけ … 続きを読む

カテゴリー: cs.CV | TokenPacker: Efficient Visual Projector for Multimodal LLM はコメントを受け付けていません

Similarity Distance-Based Label Assignment for Tiny Object Detection

要約 小さなオブジェクトの検出は、オブジェクトのサイズが限られており、情報が不足 … 続きを読む

カテゴリー: cs.CV | Similarity Distance-Based Label Assignment for Tiny Object Detection はコメントを受け付けていません