cs.AI」カテゴリーアーカイブ

Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning

要約 オフライン強化学習 (RL) は、RL エージェントが大規模なデータセット … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning はコメントを受け付けていません

Reinforcement Learning in a Safety-Embedded MDP with Trajectory Optimization

要約 安全強化学習 (RL) は、RL アルゴリズムを安全性が重要な現実世界のア … 続きを読む

カテゴリー: cs.AI, cs.RO | Reinforcement Learning in a Safety-Embedded MDP with Trajectory Optimization はコメントを受け付けていません

Ada-NAV: Adaptive Trajectory Length-Based Sample Efficient Policy Learning for Robotic Navigation

要約 軌跡の長さは、強化学習 (RL) アルゴリズム内の重要なハイパーパラメータ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Ada-NAV: Adaptive Trajectory Length-Based Sample Efficient Policy Learning for Robotic Navigation はコメントを受け付けていません

Affordance-Guided Reinforcement Learning via Visual Prompting

要約 強化学習 (RL) を備えたロボットは、報酬信号だけから幅広いスキルを学習 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Affordance-Guided Reinforcement Learning via Visual Prompting はコメントを受け付けていません

Communication- and Computation-Efficient Distributed Decision-Making in Multi-Robot Networks

要約 当社は、複数のロボット間のスケーラブルで最適に近い関節動作計画を可能にする … 続きを読む

カテゴリー: cs.AI, cs.MA, cs.RO, cs.SY, eess.SY, math.OC | Communication- and Computation-Efficient Distributed Decision-Making in Multi-Robot Networks はコメントを受け付けていません

Cooperative Reward Shaping for Multi-Agent Pathfinding

要約 マルチエージェント パスファインディング (MAPF) の主な目的は、すべ … 続きを読む

カテゴリー: cs.AI, cs.RO | Cooperative Reward Shaping for Multi-Agent Pathfinding はコメントを受け付けていません

HACMan: Learning Hybrid Actor-Critic Maps for 6D Non-Prehensile Manipulation

要約 物体を掴まずに操作することは、人間の器用さの重要な要素であり、非把握的操作 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | HACMan: Learning Hybrid Actor-Critic Maps for 6D Non-Prehensile Manipulation はコメントを受け付けていません

Learning Rapid Turning, Aerial Reorientation, and Balancing using Manipulator as a Tail

要約 この研究では、四足歩行ロボットの尾部としてマニピュレーターを革新的に使用し … 続きを読む

カテゴリー: cs.AI, cs.RO | Learning Rapid Turning, Aerial Reorientation, and Balancing using Manipulator as a Tail はコメントを受け付けていません

Learning Social Cost Functions for Human-Aware Path Planning

要約 社会的に受け入れられることは、ソーシャル ロボット ナビゲーションの主な目 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Learning Social Cost Functions for Human-Aware Path Planning はコメントを受け付けていません

Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning

要約 オフライン強化学習では、分布外 (OOD) という課題が顕著です。 これに … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning はコメントを受け付けていません