-
最近の投稿
- The Spinning Blimp: Design and Control of a Novel Minimalist Aerial Vehicle Leveraging Rotational Dynamics and Locomotion
- Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving
- GAGrasp: Geometric Algebra Diffusion for Dexterous Grasping
- DVM-SLAM: Decentralized Visual Monocular Simultaneous Localization and Mapping for Multi-Agent Systems
- Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process
-
最近のコメント
表示できるコメントはありません。 cs.AI (34738) cs.CL (26263) cs.CR (2664) cs.CV (40572) cs.LG (39741) cs.RO (20348) cs.SY (3091) eess.IV (4818) eess.SY (3085) stat.ML (5229)
「cs.CV」カテゴリーアーカイブ
STAA-SNN: Spatial-Temporal Attention Aggregator for Spiking Neural Networks
要約 スパイクニューラルネットワーク(SNN)は、生物学的妥当性とエネルギー効率 … 続きを読む
Memory Efficient Continual Learning for Edge-Based Visual Anomaly Detection
要約 視覚異常検出(VAD)は、多数の現実世界のアプリケーションを備えたコンピュ … 続きを読む
WalkVLM:Aid Visually Impaired People Walking by Vision Language Model
要約 世界中の約2億人の個人が視覚障害の程度がさまざまであるため、AIテクノロジ … 続きを読む
A Comprehensive Survey on Composed Image Retrieval
要約 Composed Image Retrieval(CIR)は、ユーザーが参 … 続きを読む
HarmonySet: A Comprehensive Dataset for Understanding Video-Music Semantic Alignment and Temporal Synchronization
要約 このペーパーでは、ビデオ音楽の理解を進めるために設計された包括的なデータセ … 続きを読む
Catheter Detection and Segmentation in X-ray Images via Multi-task Learning
要約 X線蛍光視鏡画像のカテーテルやワイヤなどの手術装置の自動検出とセグメンテー … 続きを読む
UFO: A Unified Approach to Fine-grained Visual Perception via Open-ended Language Interface
要約 ジェネラリストモデルは、言語とビジョンの両方のタスクで顕著な成功を収めてお … 続きを読む
A Joint Visual Compression and Perception Framework for Neuralmorphic Spiking Camera
要約 NeuralMorphic Spikeカメラの出現は、比類のない時間分解能 … 続きを読む
Creating Sorted Grid Layouts with Gradient-based Optimization
要約 視覚的にソートされたグリッドレイアウトは、空間的近接性を類似関係に合わせる … 続きを読む
UAR-NVC: A Unified AutoRegressive Framework for Memory-Efficient Neural Video Compression
要約 暗黙の神経表現(INR)は、ビデオをニューラルネットワークとして表現するこ … 続きを読む