-
最近の投稿
- Learning Multimodal Latent Dynamics for Human-Robot Interaction
- Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving
- Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation
- Demonstration Sidetracks: Categorizing Systematic Non-Optimality in Human Demonstrations
- Sensor Model Identification via Simultaneous Model Selection and State Variable Determination
-
最近のコメント
表示できるコメントはありません。 cs.AI (39679) cs.CL (30032) cs.CV (45003) cs.HC (3029) cs.LG (44613) cs.RO (23728) cs.SY (3617) eess.IV (5159) eess.SY (3609) stat.ML (5797)
「I.2.10」カテゴリーアーカイブ
CG-HOI: Contact-Guided 3D Human-Object Interaction Generation
要約 我々は、テキストから動的な 3D 人間とオブジェクトのインタラクション ( … 続きを読む
Extraction and Summarization of Explicit Video Content using Multi-Modal Deep Learning
要約 インターネット上でビデオ共有プラットフォームが増加するにつれ、人間が露骨な … 続きを読む
On the Overconfidence Problem in Semantic 3D Mapping
要約 セマンティック 3D マッピングは、オブジェクト クラスで注釈が付けられた … 続きを読む
Towards Multi-User Activity Recognition through Facilitated Training Data and Deep Learning for Human-Robot Collaboration Applications
要約 ヒューマン ロボット インタラクション (HRI) 研究では、ロボットが同 … 続きを読む
Diffusion-based generation of Histopathological Whole Slide Images at a Gigapixel scale
要約 我々は、前例のないギガピクセルスケールで合成病理組織学的全スライド画像(W … 続きを読む
On Measuring Faithfulness of Natural Language Explanations
要約 大規模言語モデル (LLM) は、事後または思考連鎖 (CoT) の説明を … 続きを読む
Dense Visual Odometry Using Genetic Algorithm
要約 私たちの研究は、静止シーンの RGB-D 画像から移動ロボットや移動物体の … 続きを読む
Real-time Addressee Estimation: Deployment of a Deep-Learning Model on the iCub Robot
要約 宛先推定は、人が誰に向かって話しているのかを理解する能力であり、ソーシャル … 続きを読む
Lidar Annotation Is All You Need
要約 近年、コンピュータ ビジョンは、医療画像処理、物体認識、地理空間分析などの … 続きを読む
Clustered Saliency Prediction
要約 我々は、画像の顕著性予測のための新しい手法、クラスタ化顕著性予測を提案する … 続きを読む