月別アーカイブ: 2024年7月

SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks

投稿日: 2024年7月3日作成者: jarxiv

要約セマンティックセグメンテーションにおける最先端の手法の効率を向上させるに … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Greedy-DiM: Greedy Algorithms for Unreasonably Effective Face Morphs

投稿日: 2024年7月3日作成者: jarxiv

要約モーフィング攻撃は、複数の ID の生体情報を含む 1 つの画像を作成する … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

StructLDM: Structured Latent Diffusion for 3D Human Generation

投稿日: 2024年7月3日作成者: jarxiv

要約最近の 3D 人体生成モデルは、2D 画像から 3D 対応の GAN を学 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

OpenSlot: Mixed Open-set Recognition with Object-centric Learning

投稿日: 2024年7月3日作成者: jarxiv

要約既存のオープンセット認識 (OSR) 研究では通常、各画像にはクラスラベ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Real HSI-MSI-PAN image dataset for the hyperspectral/multi-spectral/panchromatic image fusion and super-resolution fields

投稿日: 2024年7月3日作成者: jarxiv

要約現在、ハイパースペクトル画像 (HSI) 融合実験のほとんどは、異なる融合 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

SafaRi:Adaptive Sequence Transformer for Weakly Supervised Referring Expression Segmentation

投稿日: 2024年7月3日作成者: jarxiv

要約参照表現セグメンテーション (RES) は、テキストによって参照される画像 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

SINCERE: Supervised Information Noise-Contrastive Estimation REvisited

投稿日: 2024年7月3日作成者: jarxiv

要約情報ノイズ対比推定 (InfoNCE) 損失関数は、その強力な経験的結果と … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Forward Learning for Gradient-based Black-box Saliency Map Generation

投稿日: 2024年7月3日作成者: jarxiv

要約勾配ベースの顕著性マップは、ディープニューラルネットワークの決定を説明 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

TokenPacker: Efficient Visual Projector for Multimodal LLM

投稿日: 2024年7月3日作成者: jarxiv

要約ビジュアルプロジェクターは、マルチモーダル LLM (MLLM) におけ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Similarity Distance-Based Label Assignment for Tiny Object Detection

投稿日: 2024年7月3日作成者: jarxiv

要約小さなオブジェクトの検出は、オブジェクトのサイズが限られており、情報が不足 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年7月

SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks

Greedy-DiM: Greedy Algorithms for Unreasonably Effective Face Morphs

StructLDM: Structured Latent Diffusion for 3D Human Generation

OpenSlot: Mixed Open-set Recognition with Object-centric Learning

Real HSI-MSI-PAN image dataset for the hyperspectral/multi-spectral/panchromatic image fusion and super-resolution fields

SafaRi:Adaptive Sequence Transformer for Weakly Supervised Referring Expression Segmentation

SINCERE: Supervised Information Noise-Contrastive Estimation REvisited

Forward Learning for Gradient-based Black-box Saliency Map Generation

TokenPacker: Efficient Visual Projector for Multimodal LLM

Similarity Distance-Based Label Assignment for Tiny Object Detection

最近の投稿

最近のコメント

アーカイブ

カテゴリー