月別アーカイブ: 2024年7月

ViLLa: Video Reasoning Segmentation with Large Language Model

投稿日: 2024年7月30日作成者: jarxiv

要約ビデオ認識モデルは近年目覚ましい進歩を遂げていますが、ビデオ認識タスクを実 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Classification of freshwater snails of the genus \emph{Radomaniola} with multimodal triplet networks

投稿日: 2024年7月30日作成者: jarxiv

要約この論文では、\emph{Radomaniola} 属の淡水巻貝を分類する … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation

投稿日: 2024年7月30日作成者: jarxiv

要約 E-AI (Embedded AI) の基本的な側面であるビジュアルナビ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning

投稿日: 2024年7月30日作成者: jarxiv

要約拡散モデル (DM)、変分オートエンコーダー (VAE)、敵対的生成ネット … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MimiQ: Low-Bit Data-Free Quantization of Vision Transformers

投稿日: 2024年7月30日作成者: jarxiv

要約データフリー量子化 (DFQ) は、元のトレーニングデータを使用せずに、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

MaskInversion: Localized Embeddings via Optimization of Explainability Maps

投稿日: 2024年7月30日作成者: jarxiv

要約 CLIP などの視覚言語基盤モデルは、グローバルな視覚言語の調整において多 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation

投稿日: 2024年7月30日作成者: jarxiv

要約ディープ畳み込みニューラルネットワークの最近の進歩により、顕著性予測のパ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views

投稿日: 2024年7月30日作成者: jarxiv

要約都市のシーンで衛星画像から現実的な地上ビューを予測することは、衛星画像と地 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CityX: Controllable Procedural Content Generation for Unbounded 3D Cities

投稿日: 2024年7月30日作成者: jarxiv

要約現実的な大規模な 3D 仮想都市を生成することは、多数の 3D アセット、 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset

投稿日: 2024年7月30日作成者: jarxiv

要約赤外線による小型ターゲットの検出は、ターゲット固有の特徴が不足していること … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年7月

ViLLa: Video Reasoning Segmentation with Large Language Model

Classification of freshwater snails of the genus \emph{Radomaniola} with multimodal triplet networks

HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation

ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning

MimiQ: Low-Bit Data-Free Quantization of Vision Transformers

MaskInversion: Localized Embeddings via Optimization of Explainability Maps

SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation

Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views

CityX: Controllable Procedural Content Generation for Unbounded 3D Cities

Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset

最近の投稿

最近のコメント

アーカイブ

カテゴリー