A Human-Centered Safe Robot Reinforcement Learning Framework with Interactive Behaviors

要約

現実世界のロボット工学アプリケーションに強化学習 (RL) アルゴリズムを導入するには、ロボットとその環境の安全性を確保する必要があります。
Safe Robot RL (SRRL) は、人間とロボットの共存を実現するための重要なステップです。
このホワイトペーパーでは、安全な探索、安全な価値の調整、安全なコラボレーションの 3 つの段階で構成される人間中心の SRRL フレームワークを想定しています。
私たちはこれらの分野における研究のギャップを調査し、SRRL にインタラクティブな動作を活用することを提案します。
インタラクティブな動作により、人間と会話ロボット ChatGPT などのロボットの間の双方向の情報伝達が可能になります。
私たちは、インタラクティブな行動には SRRL コミュニティによるさらなる注意が必要であると主張します。
インタラクティブな動作を伴う SRRL の堅牢性、効率性、透明性、適応性に関連する 4 つの未解決の課題について説明します。

要約(オリジナル)

Deployment of Reinforcement Learning (RL) algorithms for robotics applications in the real world requires ensuring the safety of the robot and its environment. Safe Robot RL (SRRL) is a crucial step towards achieving human-robot coexistence. In this paper, we envision a human-centered SRRL framework consisting of three stages: safe exploration, safety value alignment, and safe collaboration. We examine the research gaps in these areas and propose to leverage interactive behaviors for SRRL. Interactive behaviors enable bi-directional information transfer between humans and robots, such as conversational robot ChatGPT. We argue that interactive behaviors need further attention from the SRRL community. We discuss four open challenges related to the robustness, efficiency, transparency, and adaptability of SRRL with interactive behaviors.

arxiv情報

著者 Shangding Gu,Alap Kshirsagar,Yali Du,Guang Chen,Jan Peters,Alois Knoll
発行日 2023-10-16 21:01:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク