Online Learning for Obstacle Avoidance

要約

私たちは、オンライン学習の視点から、ロボット システムの障害物回避という根本的な問題にアプローチします。
環境における不確実性の最悪の場合の実現、または不確実性の定常確率モデルのいずれかを仮定する以前の研究とは対照的に、我々は、実装が効率的であり、開いた軌道から生成される軌道の摂動に関してインスタンス最適性を証明できる方法を提案します。
– ループプランナー (最悪の場合の後悔を最小限に抑えるという意味で)。
結果として得られる政策は、不確実性の現実化にオンラインで適応しており、豊富な種類の政策から後から考えると、最良の障害回避政策と十分に匹敵することが証明されています。
この方法は、動的システム環境でのシミュレーションで検証され、ベースラインの開ループ計画および堅牢なハミルトン・ヤコビ到達可能性技術と比較されます。
さらに、四足ロボットが密集した障害物フィールドを横断し、時間遅延、モデルの不確実性、ダイナミクスの非線形性による入力外乱に遭遇するハードウェア例にも実装されています。

要約(オリジナル)

We approach the fundamental problem of obstacle avoidance for robotic systems via the lens of online learning. In contrast to prior work that either assumes worst-case realizations of uncertainty in the environment or a stationary stochastic model of uncertainty, we propose a method that is efficient to implement and provably grants instance-optimality with respect to perturbations of trajectories generated from an open-loop planner (in the sense of minimizing worst-case regret). The resulting policy adapts online to realizations of uncertainty and provably compares well with the best obstacle avoidance policy in hindsight from a rich class of policies. The method is validated in simulation on a dynamical system environment and compared to baseline open-loop planning and robust Hamilton- Jacobi reachability techniques. Further, it is implemented on a hardware example where a quadruped robot traverses a dense obstacle field and encounters input disturbances due to time delays, model uncertainty, and dynamics nonlinearities.

arxiv情報

著者 David Snyder,Meghan Booker,Nathaniel Simon,Wenhan Xia,Daniel Suo,Elad Hazan,Anirudha Majumdar
発行日 2023-11-06 03:58:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク