月別アーカイブ: 2024年7月

ViLLa: Video Reasoning Segmentation with Large Language Model

要約 ビデオ認識モデルは近年目覚ましい進歩を遂げていますが、ビデオ認識タスクを実 … 続きを読む

カテゴリー: cs.CV | ViLLa: Video Reasoning Segmentation with Large Language Model はコメントを受け付けていません

Classification of freshwater snails of the genus \emph{Radomaniola} with multimodal triplet networks

要約 この論文では、\emph{Radomaniola} 属の淡水巻貝を分類する … 続きを読む

カテゴリー: cs.CV, cs.LG | Classification of freshwater snails of the genus \emph{Radomaniola} with multimodal triplet networks はコメントを受け付けていません

HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation

要約 E-AI (Embedded AI) の基本的な側面であるビジュアル ナビ … 続きを読む

カテゴリー: cs.CV | HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation はコメントを受け付けていません

ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning

要約 拡散モデル (DM)、変分オートエンコーダー (VAE)、敵対的生成ネット … 続きを読む

カテゴリー: cs.CV, cs.LG | ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning はコメントを受け付けていません

MimiQ: Low-Bit Data-Free Quantization of Vision Transformers

要約 データフリー量子化 (DFQ) は、元のトレーニング データを使用せずに、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MimiQ: Low-Bit Data-Free Quantization of Vision Transformers はコメントを受け付けていません

MaskInversion: Localized Embeddings via Optimization of Explainability Maps

要約 CLIP などの視覚言語基盤モデルは、グローバルな視覚言語の調整において多 … 続きを読む

カテゴリー: cs.CV | MaskInversion: Localized Embeddings via Optimization of Explainability Maps はコメントを受け付けていません

SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation

要約 ディープ畳み込みニューラル ネットワークの最近の進歩により、顕著性予測のパ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation はコメントを受け付けていません

Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views

要約 都市のシーンで衛星画像から現実的な地上ビューを予測することは、衛星画像と地 … 続きを読む

カテゴリー: cs.CV | Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views はコメントを受け付けていません

CityX: Controllable Procedural Content Generation for Unbounded 3D Cities

要約 現実的な大規模な 3D 仮想都市を生成することは、多数の 3D アセット、 … 続きを読む

カテゴリー: cs.AI, cs.CV | CityX: Controllable Procedural Content Generation for Unbounded 3D Cities はコメントを受け付けていません

Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset

要約 赤外線による小型ターゲットの検出は、ターゲット固有の特徴が不足していること … 続きを読む

カテゴリー: cs.CV | Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset はコメントを受け付けていません