-
最近の投稿
- GUTS: Generalized Uncertainty-Aware Thompson Sampling for Multi-Agent Active Search
- Towards Probabilistic Inference of Human Motor Intentions by Assistive Mobile Robots Controlled via a Brain-Computer Interface
- Concerns and Values in Human-Robot Interactions: A Focus on Social Robotics
- Scaling Safe Multi-Agent Control for Signal Temporal Logic Specifications
- eKalibr: Dynamic Intrinsic Calibration for Event Cameras From First Principles of Events
-
最近のコメント
表示できるコメントはありません。 cs.AI (32102) cs.CL (24281) cs.CR (2495) cs.CV (38360) cs.LG (36991) cs.RO (18748) cs.SY (2865) eess.IV (4609) eess.SY (2859) stat.ML (4885)
月別アーカイブ: 2024年7月
ViLLa: Video Reasoning Segmentation with Large Language Model
要約 ビデオ認識モデルは近年目覚ましい進歩を遂げていますが、ビデオ認識タスクを実 … 続きを読む
カテゴリー: cs.CV
ViLLa: Video Reasoning Segmentation with Large Language Model はコメントを受け付けていません
Classification of freshwater snails of the genus \emph{Radomaniola} with multimodal triplet networks
要約 この論文では、\emph{Radomaniola} 属の淡水巻貝を分類する … 続きを読む
HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation
要約 E-AI (Embedded AI) の基本的な側面であるビジュアル ナビ … 続きを読む
カテゴリー: cs.CV
HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation はコメントを受け付けていません
ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning
要約 拡散モデル (DM)、変分オートエンコーダー (VAE)、敵対的生成ネット … 続きを読む
MimiQ: Low-Bit Data-Free Quantization of Vision Transformers
要約 データフリー量子化 (DFQ) は、元のトレーニング データを使用せずに、 … 続きを読む
MaskInversion: Localized Embeddings via Optimization of Explainability Maps
要約 CLIP などの視覚言語基盤モデルは、グローバルな視覚言語の調整において多 … 続きを読む
カテゴリー: cs.CV
MaskInversion: Localized Embeddings via Optimization of Explainability Maps はコメントを受け付けていません
SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation
要約 ディープ畳み込みニューラル ネットワークの最近の進歩により、顕著性予測のパ … 続きを読む
Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views
要約 都市のシーンで衛星画像から現実的な地上ビューを予測することは、衛星画像と地 … 続きを読む
カテゴリー: cs.CV
Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views はコメントを受け付けていません
CityX: Controllable Procedural Content Generation for Unbounded 3D Cities
要約 現実的な大規模な 3D 仮想都市を生成することは、多数の 3D アセット、 … 続きを読む
Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset
要約 赤外線による小型ターゲットの検出は、ターゲット固有の特徴が不足していること … 続きを読む
カテゴリー: cs.CV
Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset はコメントを受け付けていません