-
最近の投稿
- Learning to Recover: Dynamic Reward Shaping with Wheel-Leg Coordination for Fallen Robots
- An Integrated Visual Servoing Framework for Precise Robotic Pruning Operations in Modern Commercial Orchard
- Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties
- TD-TOG Dataset: Benchmarking Zero-Shot and One-Shot Task-Oriented Grasping for Object Generalization
- Hierarchical Intention-Aware Expressive Motion Generation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (39326) cs.CL (29768) cs.CV (44705) cs.HC (2997) cs.LG (44251) cs.RO (23494) cs.SY (3583) eess.IV (5135) eess.SY (3575) stat.ML (5752)
「I.2.10」カテゴリーアーカイブ
TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning
要約 モデルがテレビ クリップなどの複雑でマルチモーダルなコンテンツを理解するこ … 続きを読む
Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
要約 模倣学習によってトレーニングされたロボットの行動ポリシーは、トレーニング … 続きを読む
Individuation in Neural Models with and without Visual Grounding
要約 個性情報のエンコードに関して、言語と視覚のモデルである CLIP と 2 … 続きを読む
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
要約 自動運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
要約 自動運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む
Towards Global Localization using Multi-Modal Object-Instance Re-Identification
要約 再識別 (ReID) はコンピュータ ビジョンにおける重要な課題であり、主 … 続きを読む
Towards Localizing Structural Elements: Merging Geometrical Detection with Semantic Verification in RGB-D Data
要約 RGB-D カメラは、シーンの理解、マップの再構築、位置特定などのさまざま … 続きを読む
StratXplore: Strategic Novelty-seeking and Instruction-aligned Exploration for Vision and Language Navigation
要約 身体的ナビゲーションでは、ロボットが与えられたタスクに基づいて環境を理解し … 続きを読む
Spatially-Aware Speaker for Vision-and-Language Navigation Instruction Generation
要約 身体化型 AI は、人間の言語の命令を \textit{理解}して実行し、 … 続きを読む
SITransformer: Shared Information-Guided Transformer for Extreme Multimodal Summarization
要約 Extreme Multimodal Summarization with … 続きを読む