SoNIC: Safe Social Navigation with Adaptive Conformal Inference and Constrained Reinforcement Learning


強化学習 (RL) により、ソーシャル ロボットは人間が設計したルールや介入なしで軌道を生成できるようになり、複雑な現実世界のシナリオに一般化する場合、ハードコードされたシステムよりも効果的になります。
しかし、ソーシャル ナビゲーションは、ロボットが歩行者との衝突を回避する必要がある安全性が重要なタスクであり、これまでの RL ベースのソリューションは複雑な環境における安全性能が不十分です。
RL ポリシーの安全性を強化するために、私たちの知る限り、適応等形推論 (ACI) と制約付き強化学習 (CRL) を統合してソーシャル ナビゲーションのための安全なポリシーを学習する最初のアルゴリズム SoNIC を提案します。
より具体的には、私たちの方法は、ACI が生成した不適合スコアで RL 観察を強化し、安全制約と空間緩和を組み込むことで安全上重要な領域を回避するために不確実性メトリクスを活用するための明示的なガイダンスをエージェントに提供します。
コードとビデオのデモは、プロジェクト Web サイト で入手できます。


Reinforcement Learning (RL) has enabled social robots to generate trajectories without human-designed rules or interventions, which makes it more effective than hard-coded systems for generalizing to complex real-world scenarios. However, social navigation is a safety-critical task that requires robots to avoid collisions with pedestrians while previous RL-based solutions fall short in safety performance in complex environments. To enhance the safety of RL policies, to the best of our knowledge, we propose the first algorithm, SoNIC, that integrates adaptive conformal inference (ACI) with constrained reinforcement learning (CRL) to learn safe policies for social navigation. More specifically, our method augments RL observations with ACI-generated nonconformity scores and provides explicit guidance for agents to leverage the uncertainty metrics to avoid safety-critical areas by incorporating safety constraints with spatial relaxation. Our method outperforms state-of-the-art baselines in terms of both safety and adherence to social norms by a large margin and demonstrates much stronger robustness to out-of-distribution scenarios. Our code and video demos are available on our project website:


著者 Jianpeng Yao,Xiaopan Zhang,Yu Xia,Zejin Wang,Amit K. Roy-Chowdhury,Jiachen Li
発行日 2024-07-24 17:57:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY パーマリンク