Obstacle Avoidance Deep Reinforcement Learning-Based Trajectory Planner with Robust Low-Level Control for Robotic Manipulators

要約

ロボット工学において、現代の戦略は学習ベースであり、複雑なブラックボックス的性質と解釈可能性の欠如を特徴とし、安定性と安全性の確保に課題をもたらす可能性がある。このような問題に対処するため、我々は障害物のない深層強化学習(DRL)軌道プランナーを、環境との相互作用を通じて学習フェーズに能動的に関与しながら、新しいオートチューニング・ローおよび関節レベル制御戦略と統合することを提案する。このアプローチでは、計算による複雑さを回避すると同時に、非反復的でランダムな障害物回避タスクにも対応します。まず、タスク空間内の自由度(DoF)が「n」であるマニピュレーターに対して、関節レベルの推論により、速度に縛られず障害物のない運動を計画するモデルフリーDRLエージェントを採用します。この計画をロバストサブシステムベースの適応コントローラに入力し、必要なトルクを生成します。一方、カッコー探索最適化(CSO)アルゴリズムは、到達に要する時間、安定化に要する時間、所望の値からの最大偏差、定常状態での持続的なトラッキングエラーを最小化するように制御ゲインを向上させます。このアプローチでは、位置と速度の誤差が指数関数的にゼロに収束することが保証され、初期および終点の変動、未知のモデル化誤差、外乱を考慮する。理論的な主張は、シミュレーション結果の提示を通じて検証される。

要約(オリジナル)

In robotics, contemporary strategies are learning-based, characterized by a complex black-box nature and a lack of interpretability, which may pose challenges in ensuring stability and safety. To address these issues, we propose integrating an obstacle-free deep reinforcement learning (DRL) trajectory planner with a novel auto-tuning low- and joint-level control strategy, all while actively engaging in the learning phase through interactions with the environment. This approach circumvents the complexities associated with computations while also addressing nonrepetitive and random obstacle avoidance tasks. First, a model-free DRL agent to plan velocity-bounded and obstacle-free motion is employed for a manipulator with ‘n’ degrees of freedom (DoF) in task space through joint-level reasoning. This plan is then input into a robust subsystem-based adaptive controller, which produces the necessary torques, while the Cuckoo Search Optimization (CSO) algorithm enhances control gains to minimize the time required to reach, time taken to stabilize, the maximum deviation from the desired value, and persistent tracking error in the steady state. This approach guarantees that position and velocity errors exponentially converge to zero, accounting for any initial and end-point variations, unknown modeling errors, and external disturbances. Theoretical assertions are validated through the presentation of simulation outcomes.

arxiv情報

著者 Mehdi Heydari Shahna,Seyed Adel Alizadeh Kolagar,Jouni Mattila
発行日 2024-02-04 15:54:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク