「cs.AI」カテゴリーアーカイブ

Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning

投稿日: 2024年7月16日作成者: jarxiv

要約オフライン強化学習 (RL) は、RL エージェントが大規模なデータセット … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Reinforcement Learning in a Safety-Embedded MDP with Trajectory Optimization

投稿日: 2024年7月16日作成者: jarxiv

要約安全強化学習 (RL) は、RL アルゴリズムを安全性が重要な現実世界のア … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Ada-NAV: Adaptive Trajectory Length-Based Sample Efficient Policy Learning for Robotic Navigation

投稿日: 2024年7月16日作成者: jarxiv

要約軌跡の長さは、強化学習 (RL) アルゴリズム内の重要なハイパーパラメータ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Affordance-Guided Reinforcement Learning via Visual Prompting

投稿日: 2024年7月16日作成者: jarxiv

要約強化学習 (RL) を備えたロボットは、報酬信号だけから幅広いスキルを学習 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Communication- and Computation-Efficient Distributed Decision-Making in Multi-Robot Networks

投稿日: 2024年7月16日作成者: jarxiv

要約当社は、複数のロボット間のスケーラブルで最適に近い関節動作計画を可能にする … 続きを読む →

カテゴリー: cs.AI, cs.MA, cs.RO, cs.SY, eess.SY, math.OC | コメントを受け付けていません

Cooperative Reward Shaping for Multi-Agent Pathfinding

投稿日: 2024年7月16日作成者: jarxiv

要約マルチエージェントパスファインディング (MAPF) の主な目的は、すべ … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

HACMan: Learning Hybrid Actor-Critic Maps for 6D Non-Prehensile Manipulation

投稿日: 2024年7月16日作成者: jarxiv

要約物体を掴まずに操作することは、人間の器用さの重要な要素であり、非把握的操作 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Learning Rapid Turning, Aerial Reorientation, and Balancing using Manipulator as a Tail

投稿日: 2024年7月16日作成者: jarxiv

要約この研究では、四足歩行ロボットの尾部としてマニピュレーターを革新的に使用し … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Learning Social Cost Functions for Human-Aware Path Planning

投稿日: 2024年7月16日作成者: jarxiv

要約社会的に受け入れられることは、ソーシャルロボットナビゲーションの主な目 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning

投稿日: 2024年7月16日作成者: jarxiv

要約オフライン強化学習では、分布外 (OOD) という課題が顕著です。これに … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning

Reinforcement Learning in a Safety-Embedded MDP with Trajectory Optimization

Ada-NAV: Adaptive Trajectory Length-Based Sample Efficient Policy Learning for Robotic Navigation

Affordance-Guided Reinforcement Learning via Visual Prompting

Communication- and Computation-Efficient Distributed Decision-Making in Multi-Robot Networks

Cooperative Reward Shaping for Multi-Agent Pathfinding

HACMan: Learning Hybrid Actor-Critic Maps for 6D Non-Prehensile Manipulation

Learning Rapid Turning, Aerial Reorientation, and Balancing using Manipulator as a Tail

Learning Social Cost Functions for Human-Aware Path Planning

Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー