-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「I.2.10」カテゴリーアーカイブ
CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D Object Detection
要約 最近の LiDAR ベースの 3D 物体検出 (3DOD) 手法は有望な結 … 続きを読む
Learning 3D object-centric representation through prediction
要約 人間の核となる知識の一部として、オブジェクトの表現は、高レベルの概念と象徴 … 続きを読む
TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning
要約 テレビクリップのような複雑なマルチモーダルコンテンツに対して質問応答を行う … 続きを読む
TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning
要約 テレビ クリップなどの複雑でマルチモーダルなコンテンツに対して質問応答を実 … 続きを読む
RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation
要約 オープンワールドのロボット操作のための高レベルのタスク計画とコード生成の急 … 続きを読む
Beyond still images: Temporal features and input variance resilience
要約 従来、視覚モデルは主に静止画像から抽出された空間特徴に依存しており、自然視 … 続きを読む
UAV-assisted Visual SLAM Generating Reconstructed 3D Scene Graphs in GPS-denied Environments
要約 航空ロボットは、環境に関するロボットの状況認識が基本的な要求となるさまざま … 続きを読む
Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos
要約 ビデオ アクション セグメンテーションは、多くの分野で広く適用されています … 続きを読む
CC-SGG: Corner Case Scenario Generation using Learned Scene Graphs
要約 コーナーケースのシナリオは、自動運転車 (AV) の安全性をテストおよび検 … 続きを読む
Motion Perceiver: Real-Time Occupancy Forecasting for Embedded Systems
要約 本研究では、ソフトIOUのWaymo Open Motion Datase … 続きを読む