cs.RO」カテゴリーアーカイブ

Towards Safe Path Tracking Using the Simplex Architecture

要約 複雑な環境でのロボットナビゲーションには、適応的で安全なコントローラーが必 … 続きを読む

カテゴリー: cs.RO | Towards Safe Path Tracking Using the Simplex Architecture はコメントを受け付けていません

OSMa-Bench: Evaluating Open Semantic Mapping Under Varying Lighting Conditions

要約 オープンセマンティックマッピング(OSM)は、セマンティックセグメンテーシ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | OSMa-Bench: Evaluating Open Semantic Mapping Under Varying Lighting Conditions はコメントを受け付けていません

World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning

要約 大規模な視覚言語モデル(LVLMS)の最近の進歩は、具体化されたタスク計画 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning はコメントを受け付けていません

Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation

要約 Rehnection Learning(RL)は、ロボットナビゲーションの … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation はコメントを受け付けていません

KUDA: Keypoints to Unify Dynamics Learning and Visual Prompting for Open-Vocabulary Robotic Manipulation

要約 大規模な言語モデル(LLMS)とビジョン言語モデル(VLMS)の急速な進歩 … 続きを読む

カテゴリー: cs.AI, cs.RO | KUDA: Keypoints to Unify Dynamics Learning and Visual Prompting for Open-Vocabulary Robotic Manipulation はコメントを受け付けていません

DriveLMM-o1: A Step-by-Step Reasoning Dataset and Large Multimodal Model for Driving Scenario Understanding

要約 大規模なマルチモーダルモデル(LMM)は、さまざまな視覚的質問応答(VQA … 続きを読む

カテゴリー: cs.CV, cs.RO | DriveLMM-o1: A Step-by-Step Reasoning Dataset and Large Multimodal Model for Driving Scenario Understanding はコメントを受け付けていません

NIL: No-data Imitation Learning by Leveraging Pre-trained Video Diffusion Models

要約 ヒューマノイドロボット、4倍、動物など、多様で型破りな形態学を介して身体的 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | NIL: No-data Imitation Learning by Leveraging Pre-trained Video Diffusion Models はコメントを受け付けていません

UniGoal: Towards Universal Zero-shot Goal-oriented Navigation

要約 この論文では、ユニバーサルゼロショットの目標指向ナビゲーションの一般的なフ … 続きを読む

カテゴリー: cs.CV, cs.RO | UniGoal: Towards Universal Zero-shot Goal-oriented Navigation はコメントを受け付けていません

HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model

要約 一般的な推論のための視覚言語モデル(VLM)の最近の進歩により、視覚言語ア … 続きを読む

カテゴリー: cs.CV, cs.RO | HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model はコメントを受け付けていません

2HandedAfforder: Learning Precise Actionable Bimanual Affordances from Human Videos

要約 オブジェクトと相互作用する場合、人間は、意図したアクション、つまりオブジェ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | 2HandedAfforder: Learning Precise Actionable Bimanual Affordances from Human Videos はコメントを受け付けていません