-
最近の投稿
- Characterizing Trust and Resilience in Distributed Consensus for Cyberphysical Systems
- ROMAN: Open-Set Object Map Alignment for Robust View-Invariant Global Localization
- Mobile Robot Navigation Using Hand-Drawn Maps: A Vision Language Model Approach
- SOLAQUA: SINTEF Ocean Large Aquaculture Robotics Dataset
- Improving trajectory continuity in drone-based crowd monitoring using a set of minimal-cost techniques and deep discriminative correlation filters
-
最近のコメント
表示できるコメントはありません。 cs.AI (37321) cs.CL (28240) cs.CV (43015) cs.HC (2853) cs.LG (42261) cs.RO (22134) cs.SY (3385) eess.IV (5002) eess.SY (3377) stat.ML (5523)
月別アーカイブ: 2024年7月
ViLLa: Video Reasoning Segmentation with Large Language Model
要約 ビデオ認識モデルは近年目覚ましい進歩を遂げていますが、ビデオ認識タスクを実 … 続きを読む
カテゴリー: cs.CV
ViLLa: Video Reasoning Segmentation with Large Language Model はコメントを受け付けていません
Classification of freshwater snails of the genus \emph{Radomaniola} with multimodal triplet networks
要約 この論文では、\emph{Radomaniola} 属の淡水巻貝を分類する … 続きを読む
HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation
要約 E-AI (Embedded AI) の基本的な側面であるビジュアル ナビ … 続きを読む
カテゴリー: cs.CV
HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation はコメントを受け付けていません
ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning
要約 拡散モデル (DM)、変分オートエンコーダー (VAE)、敵対的生成ネット … 続きを読む
MimiQ: Low-Bit Data-Free Quantization of Vision Transformers
要約 データフリー量子化 (DFQ) は、元のトレーニング データを使用せずに、 … 続きを読む
MaskInversion: Localized Embeddings via Optimization of Explainability Maps
要約 CLIP などの視覚言語基盤モデルは、グローバルな視覚言語の調整において多 … 続きを読む
カテゴリー: cs.CV
MaskInversion: Localized Embeddings via Optimization of Explainability Maps はコメントを受け付けていません
SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation
要約 ディープ畳み込みニューラル ネットワークの最近の進歩により、顕著性予測のパ … 続きを読む
Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views
要約 都市のシーンで衛星画像から現実的な地上ビューを予測することは、衛星画像と地 … 続きを読む
カテゴリー: cs.CV
Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views はコメントを受け付けていません
CityX: Controllable Procedural Content Generation for Unbounded 3D Cities
要約 現実的な大規模な 3D 仮想都市を生成することは、多数の 3D アセット、 … 続きを読む
Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset
要約 赤外線による小型ターゲットの検出は、ターゲット固有の特徴が不足していること … 続きを読む
カテゴリー: cs.CV
Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset はコメントを受け付けていません