要約
実世界でのロボット工学アプリケーションに強化学習アルゴリズムを展開するには、ロボットとその環境の安全性を確保する必要があります。
安全なロボット強化学習 (SRRL) は、人間とロボットの共存を実現するための重要なステップです。
このホワイトペーパーでは、安全な探索、安全性の価値の調整、安全なコラボレーションの 3 つの段階で構成される人間中心の SRRL フレームワークを想定しています。
これらの分野における研究のギャップを調べ、SRRL のインタラクティブな動作を活用することを提案します。
インタラクティブな動作により、会話型ロボット ChatGPT などの人間とロボットの間の双方向の情報転送が可能になります。
インタラクティブな動作には、SRRL コミュニティからのさらなる注意が必要であると主張します。
インタラクティブな動作を伴う SRRL の堅牢性、効率性、透明性、および適応性に関連する 4 つの未解決の課題について説明します。
要約(オリジナル)
Deployment of reinforcement learning algorithms for robotics applications in the real world requires ensuring the safety of the robot and its environment. Safe robot reinforcement learning (SRRL) is a crucial step towards achieving human-robot coexistence. In this paper, we envision a human-centered SRRL framework consisting of three stages: safe exploration, safety value alignment, and safe collaboration. We examine the research gaps in these areas and propose to leverage interactive behaviors for SRRL. Interactive behaviors enable bi-directional information transfer between humans and robots, such as conversational robot ChatGPT. We argue that interactive behaviors need further attention from the SRRL community. We discuss four open challenges related to the robustness, efficiency, transparency, and adaptability of SRRL with interactive behaviors.
arxiv情報
| 著者 | Shangding Gu,Alap Kshirsagar,Yali Du,Guang Chen,Jan Peters,Alois Knoll |
| 発行日 | 2023-03-02 12:41:01+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google