-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
ViLLa: Video Reasoning Segmentation with Large Language Model
要約 ビデオ認識モデルは近年目覚ましい進歩を遂げていますが、ビデオ認識タスクを実 … 続きを読む
カテゴリー: cs.CV
ViLLa: Video Reasoning Segmentation with Large Language Model はコメントを受け付けていません
Classification of freshwater snails of the genus \emph{Radomaniola} with multimodal triplet networks
要約 この論文では、\emph{Radomaniola} 属の淡水巻貝を分類する … 続きを読む
HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation
要約 E-AI (Embedded AI) の基本的な側面であるビジュアル ナビ … 続きを読む
カテゴリー: cs.CV
HabiCrowd: A High Performance Simulator for Crowd-Aware Visual Navigation はコメントを受け付けていません
ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning
要約 拡散モデル (DM)、変分オートエンコーダー (VAE)、敵対的生成ネット … 続きを読む
MimiQ: Low-Bit Data-Free Quantization of Vision Transformers
要約 データフリー量子化 (DFQ) は、元のトレーニング データを使用せずに、 … 続きを読む
MaskInversion: Localized Embeddings via Optimization of Explainability Maps
要約 CLIP などの視覚言語基盤モデルは、グローバルな視覚言語の調整において多 … 続きを読む
カテゴリー: cs.CV
MaskInversion: Localized Embeddings via Optimization of Explainability Maps はコメントを受け付けていません
SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation
要約 ディープ畳み込みニューラル ネットワークの最近の進歩により、顕著性予測のパ … 続きを読む
Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views
要約 都市のシーンで衛星画像から現実的な地上ビューを予測することは、衛星画像と地 … 続きを読む
カテゴリー: cs.CV
Geospecific View Generation — Geometry-Context Aware High-resolution Ground View Inference from Satellite Views はコメントを受け付けていません
CityX: Controllable Procedural Content Generation for Unbounded 3D Cities
要約 現実的な大規模な 3D 仮想都市を生成することは、多数の 3D アセット、 … 続きを読む
Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset
要約 赤外線による小型ターゲットの検出は、ターゲット固有の特徴が不足していること … 続きを読む
カテゴリー: cs.CV
Background Semantics Matter: Cross-Task Feature Exchange Network for Clustered Infrared Small Target Detection With Sky-Annotated Dataset はコメントを受け付けていません