cs.CV」カテゴリーアーカイブ

GSE: Group-wise Sparse and Explainable Adversarial Attacks

要約 まばらな敵対的攻撃は、多くの場合 $\ell_0$ ノルムによって正規化さ … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG, math.OC | GSE: Group-wise Sparse and Explainable Adversarial Attacks はコメントを受け付けていません

Generating Out-Of-Distribution Scenarios Using Language Models

要約 機械学習技術によって制御される自動運転車の導入には、現実世界の多様な環境で … 続きを読む

カテゴリー: cs.CV, cs.LG | Generating Out-Of-Distribution Scenarios Using Language Models はコメントを受け付けていません

J-CaPA : Joint Channel and Pyramid Attention Improves Medical Image Segmentation

要約 医療画像のセグメンテーションは、診断と治療計画に不可欠です。 U-Net … 続きを読む

カテゴリー: cs.CV | J-CaPA : Joint Channel and Pyramid Attention Improves Medical Image Segmentation はコメントを受け付けていません

A Review of Mechanistic Models of Event Comprehension

要約 このレビューでは、談話理解理論から現代の出来事認識フレームワークへの進化を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | A Review of Mechanistic Models of Event Comprehension はコメントを受け付けていません

Rethinking Diffusion for Text-Driven Human Motion Generation

要約 2023 年以降、ベクトル量子化 (VQ) ベースの離散生成手法が人間のモ … 続きを読む

カテゴリー: cs.CV | Rethinking Diffusion for Text-Driven Human Motion Generation はコメントを受け付けていません

CSA: Data-efficient Mapping of Unimodal Features to Multimodal Features

要約 CLIP のようなマルチモーダル エンコーダは、ゼロショット画像分類やクロ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG | CSA: Data-efficient Mapping of Unimodal Features to Multimodal Features はコメントを受け付けていません

CoHD: A Counting-Aware Hierarchical Decoding Framework for Generalized Referring Expression Segmentation

要約 新しく提案された Generalized Referring Expres … 続きを読む

カテゴリー: cs.AI, cs.CV | CoHD: A Counting-Aware Hierarchical Decoding Framework for Generalized Referring Expression Segmentation はコメントを受け付けていません

Unlocking The Potential of Adaptive Attacks on Diffusion-Based Purification

要約 拡散ベースの浄化 (DBP) は、敵対的例 (AE) に対する防御であり、 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Unlocking The Potential of Adaptive Attacks on Diffusion-Based Purification はコメントを受け付けていません

Chat2SVG: Vector Graphics Generation with Large Language Models and Image Diffusion Models

要約 スケーラブル ベクター グラフィックス (SVG) は、デジタル デザイン … 続きを読む

カテゴリー: cs.CV, cs.GR | Chat2SVG: Vector Graphics Generation with Large Language Models and Image Diffusion Models はコメントを受け付けていません

GeoFormer: A Multi-Polygon Segmentation Transformer

要約 リモート センシングでは、建物などのオブジェクトのスケール不変の形状を学習 … 続きを読む

カテゴリー: cs.CV | GeoFormer: A Multi-Polygon Segmentation Transformer はコメントを受け付けていません