-
最近の投稿
- Geometric Impedance Control on SE(3) for Robotic Manipulators
- Adaptive Energy Regularization for Autonomous Gait Transition and Energy-Efficient Quadruped Locomotion
- CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving
- Affordance-Guided Reinforcement Learning via Visual Prompting
- OpenGV 2.0: Motion prior-assisted calibration and SLAM with vehicle-mounted surround-view systems
-
最近のコメント
表示できるコメントはありません。 cs.AI (34674) cs.CL (26212) cs.CR (2657) cs.CV (40510) cs.LG (39676) cs.RO (20296) cs.SY (3081) eess.IV (4814) eess.SY (3075) stat.ML (5222)
「cs.CV」カテゴリーアーカイブ
OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction
要約 Vision-Language-action(VLA)モデルは、視覚的な観 … 続きを読む
NVILA: Efficient Frontier Visual Language Models
要約 視覚言語モデル(VLM)は、近年、精度に大きな進歩を遂げています。 しかし … 続きを読む
GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control
要約 正確なカメラ制御と時間的な3D一貫性を備えた生成ビデオモデルであるGen3 … 続きを読む
A Multi-Sensor Fusion Approach for Rapid Orthoimage Generation in Large-Scale UAV Mapping
要約 無人航空機(UAV)からの大規模なオルソイメージの急速な生成は、航空マッピ … 続きを読む
STAA-SNN: Spatial-Temporal Attention Aggregator for Spiking Neural Networks
要約 スパイクニューラルネットワーク(SNN)は、生物学的妥当性とエネルギー効率 … 続きを読む
Near-infrared Image Deblurring and Event Denoising with Synergistic Neuromorphic Imaging
要約 夜間のダイナミックおよびその他の非常に暗い条件におけるイメージングの分野は … 続きを読む
ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points
要約 アーキテクチャプログラムに基づいて構築された新しい学習フレームワークである … 続きを読む
Unified Video Action Model
要約 統一されたビデオとアクションモデルは、動画がアクション予測のための豊富なシ … 続きを読む
OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation
要約 Vision-Language Navigation(VLN)は、言語の指 … 続きを読む