要約
自律的に動作するロボットがオンラインで最善の行動だけでなく、実行すべき安全な行動を見つけるには、将来のリスクを考慮することが不可欠です。
この論文では、最近導入された確率的信念依存制約の定式化に基づいて構築します。
連続ドメインでモンテカルロ ツリー検索 (MCTS) 法を採用したいつでもアプローチを提案します。
従来のアプローチとは異なり、私たちの方法は、検索の収束に依存せず、現在展開されている検索ツリーに関していつでも安全性を保証します。
私たちは、アルゴリズムのバージョンの指数関数的な比率で確率が収束することを証明し、広範なシミュレーションを通じて提案された手法を研究します。
ツリー クエリの数が少ない場合でも、私たちのアプローチによって見つかった最適なアクションは、ベースラインよりもはるかに安全です。
さらに、私たちのアプローチは、目標の点でベースラインのアクションよりも優れていることが常に見つかります。
これは、検索ツリーに保持されている値と統計を修正し、プルーニングされたアクションの寄与をそれらから削除するためです。
要約(オリジナル)
Taking into account future risk is essential for an autonomously operating robot to find online not only the best but also a safe action to execute. In this paper, we build upon the recently introduced formulation of probabilistic belief-dependent constraints. We present an anytime approach employing the Monte Carlo Tree Search (MCTS) method in continuous domains. Unlike previous approaches, our method assures safety anytime with respect to the currently expanded search tree without relying on the convergence of the search. We prove convergence in probability with an exponential rate of a version of our algorithms and study proposed techniques via extensive simulations. Even with a tiny number of tree queries, the best action found by our approach is much safer than the baseline. Moreover, our approach constantly finds better than the baseline action in terms of objective. This is because we revise the values and statistics maintained in the search tree and remove from them the contribution of the pruned actions.
arxiv情報
著者 | Andrey Zhitnikov,Vadim Indelman |
発行日 | 2024-11-11 04:42:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google