-
最近の投稿
- The Spinning Blimp: Design and Control of a Novel Minimalist Aerial Vehicle Leveraging Rotational Dynamics and Locomotion
- Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving
- GAGrasp: Geometric Algebra Diffusion for Dexterous Grasping
- DVM-SLAM: Decentralized Visual Monocular Simultaneous Localization and Mapping for Multi-Agent Systems
- Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process
-
最近のコメント
表示できるコメントはありません。 cs.AI (34738) cs.CL (26263) cs.CR (2664) cs.CV (40572) cs.LG (39741) cs.RO (20348) cs.SY (3091) eess.IV (4818) eess.SY (3085) stat.ML (5229)
「cs.CV」カテゴリーアーカイブ
Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames
要約 RBG画像からのテクスチャーのないオブジェクトの6Dポーズを推定することは … 続きを読む
Rethinking Deep Clustering Paradigms: Self-Supervision Is All You Need
要約 深いクラスタリングの最近の進歩は、自己教師と疑似監督の学習の大幅な進歩によ … 続きを読む
OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction
要約 Vision-Language-action(VLA)モデルは、視覚的な観 … 続きを読む
NVILA: Efficient Frontier Visual Language Models
要約 視覚言語モデル(VLM)は、近年、精度に大きな進歩を遂げています。 しかし … 続きを読む
GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control
要約 正確なカメラ制御と時間的な3D一貫性を備えた生成ビデオモデルであるGen3 … 続きを読む
A Multi-Sensor Fusion Approach for Rapid Orthoimage Generation in Large-Scale UAV Mapping
要約 無人航空機(UAV)からの大規模なオルソイメージの急速な生成は、航空マッピ … 続きを読む
STAA-SNN: Spatial-Temporal Attention Aggregator for Spiking Neural Networks
要約 スパイクニューラルネットワーク(SNN)は、生物学的妥当性とエネルギー効率 … 続きを読む
Near-infrared Image Deblurring and Event Denoising with Synergistic Neuromorphic Imaging
要約 夜間のダイナミックおよびその他の非常に暗い条件におけるイメージングの分野は … 続きを読む
ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points
要約 アーキテクチャプログラムに基づいて構築された新しい学習フレームワークである … 続きを読む
Unified Video Action Model
要約 統一されたビデオとアクションモデルは、動画がアクション予測のための豊富なシ … 続きを読む