Online Update of Safety Assurances Using Confidence-Based Predictions

要約

自律走行車や支援マニピュレーターなどのロボットは、動的環境や人間に物理的に近い場所で動作することが増えています。
このようなシナリオでは、ロボットは人間の動作予測機能を活用して、人間の将来の状態を予測し、安全で効率的な軌道を計画できます。
ただし、完璧なモデルはありません。観察された人間の行動がモデルの予測から逸脱すると、ロボットは危険な操縦を計画する可能性があります。
最近の研究では、この課題を克服するために人間モデルの信頼パラメータを維持することが検討されており、予測された人間の行動は、予測モデルの下で観察された人間の行動の尤度に基づいてオンラインで調整されます。
これにより、新しい研究課題、つまり \textit{信頼パラメータの変化に応じてオンラインで将来の人間の状態を計算する方法?} が開かれました。この研究では、この課題を克服するために、Hamilton-Jacobi (HJ) 到達可能性ベースのアプローチを提案します。

信頼パラメータをシステム内の仮想状態として扱い、信頼パラメータの関数として将来の人間の状態を提供するパラメータ条件付き前方到達チューブ (FRT) を計算します。
オンラインでは、信頼度パラメーターが変化するにつれて、対応する FRT を単純にクエリし、それを使用してロボット プランを更新することができます。
パラメーター条件付き FRT の計算は、(オフラインの) 高次元の到達可能性問題に対応します。この問題は、データ駆動型の到達可能性分析における最近の進歩を活用して解決されます。
全体として、私たちのフレームワークは、人間の予測モデルが間違っている場合でも、人間とロボットのインタラクションシナリオにおける安全性保証のオンラインメンテナンスと更新を可能にします。
私たちは、最先端の深層学習ベースの予測モデルを使用して、安全性が重要ないくつかの自動運転シナリオで当社のアプローチを実証します。

要約(オリジナル)

Robots such as autonomous vehicles and assistive manipulators are increasingly operating in dynamic environments and close physical proximity to people. In such scenarios, the robot can leverage a human motion predictor to predict their future states and plan safe and efficient trajectories. However, no model is ever perfect — when the observed human behavior deviates from the model predictions, the robot might plan unsafe maneuvers. Recent works have explored maintaining a confidence parameter in the human model to overcome this challenge, wherein the predicted human actions are tempered online based on the likelihood of the observed human action under the prediction model. This has opened up a new research challenge, i.e., \textit{how to compute the future human states online as the confidence parameter changes?} In this work, we propose a Hamilton-Jacobi (HJ) reachability-based approach to overcome this challenge. Treating the confidence parameter as a virtual state in the system, we compute a parameter-conditioned forward reachable tube (FRT) that provides the future human states as a function of the confidence parameter. Online, as the confidence parameter changes, we can simply query the corresponding FRT, and use it to update the robot plan. Computing parameter-conditioned FRT corresponds to an (offline) high-dimensional reachability problem, which we solve by leveraging recent advances in data-driven reachability analysis. Overall, our framework enables online maintenance and updates of safety assurances in human-robot interaction scenarios, even when the human prediction model is incorrect. We demonstrate our approach in several safety-critical autonomous driving scenarios, involving a state-of-the-art deep learning-based prediction model.

arxiv情報

著者 Kensuke Nakamura,Somil Bansal
発行日 2023-06-05 22:35:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク