Towards Online Safety Corrections for Robotic Manipulation Policies

要約

ロボティクスへの強化学習 (RL) の適用における最近の成功により、それがロボット コントローラーを構築するための実行可能なアプローチであることが示されました。
ただし、RL コントローラーは、実行中に新しい障害物が現れる環境では多くの衝突を引き起こす可能性があります。
これは、安全性が重要な設定において問題を引き起こします。
我々は、実行時に RL ポリシーによって提案されたアクションを修正するために逆運動学二次計画法 (iKinQP) コントローラーを使用する iKinQP-RL と呼ばれるハイブリッド アプローチを紹介します。
これにより、トレーニング中に存在しない新たな障害物が存在する場合でも、安全に実行できます。
予備実験では、iKinQP-RL フレームワークが高いタスク成功率を維持しながら、新たな障害物との衝突を完全に排除することが示されています。

要約(オリジナル)

Recent successes in applying reinforcement learning (RL) for robotics has shown it is a viable approach for constructing robotic controllers. However, RL controllers can produce many collisions in environments where new obstacles appear during execution. This poses a problem in safety-critical settings. We present a hybrid approach, called iKinQP-RL, that uses an Inverse Kinematics Quadratic Programming (iKinQP) controller to correct actions proposed by an RL policy at runtime. This ensures safe execution in the presence of new obstacles not present during training. Preliminary experiments illustrate our iKinQP-RL framework completely eliminates collisions with new obstacles while maintaining a high task success rate.

arxiv情報

著者 Ariana Spalter,Mark Roberts,Laura M. Hiatt
発行日 2024-09-12 17:31:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク