-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.CV」カテゴリーアーカイブ
Real-time Multi-view Omnidirectional Depth Estimation System for Robots and Autonomous Driving on Real Scenes
要約 全方向深度推定は、ロボットナビゲーションや自動運転などの分野で幅広い応用が … 続きを読む
CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration
要約 画像からポイント クラウド (I2P) への登録は、ロボットや自動運転車が … 続きを読む
InterACT: Inter-dependency Aware Action Chunking with Hierarchical Attention Transformers for Bimanual Manipulation
要約 我々は、InterACT: 階層的注意トランスフォーマーによる相互依存性を … 続きを読む
BEVal: A Cross-dataset Evaluation Study of BEV Segmentation Models for Autonomous Driving
要約 自動運転のためのセマンティック鳥瞰図セグメンテーションに関する現在の研究は … 続きを読む
LED: Light Enhanced Depth Estimation at Night
要約 夜間のカメラベースの深度推定は、安全なナビゲーションを確保するために正確な … 続きを読む
Alignment of Diffusion Models: Fundamentals, Challenges, and Future
要約 拡散モデルは生成モデリングの主要なパラダイムとして台頭しており、さまざまな … 続きを読む
RoboUniView: Visual-Language Model with Unified View Representation for Robotic Manipulation
要約 ロボット操作に視覚言語モデル (VLM) を利用することは、新しいパラダイ … 続きを読む
Multi-object event graph representation learning for Video Question Answering
要約 ビデオ質問応答 (VideoQA) は、特定のビデオに関して提起された質問 … 続きを読む
Top-down Activity Representation Learning for Video Question Answering
要約 高性能のビデオ質問応答 (VideoQA) を実現するには、原子的なアクシ … 続きを読む
AIC MLLM: Autonomous Interactive Correction MLLM for Robust Robotic Manipulation
要約 失敗を反映して修正する機能は、ロボット システムが現実のオブジェクトと安定 … 続きを読む