Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks

要約

ロボット工学における現代の戦略は学習ベースであり、複雑なブラックボックスの性質と解釈可能性の欠如を特徴とし、安定性と安全性を確保する上で課題を引き起こす可能性があります。
これらの問題に対処するために、深層強化学習 (DRL) に基づく衝突のない軌道プランナーと新しい自動調整低レベル制御戦略を統合し、環境との相互作用を通じて学習フェーズに積極的に関与することを提案します。
このアプローチは、障害物の存在下での非反復的な到達タスクに対処しながら、制御パフォーマンスと計算に関連する複雑さを回避します。
まず、モデルフリーの DRL エージェントを使用して、「n」自由度 (DoF) のマニピュレーターの速度制限された動きを計画し、ジョイント レベルの推論を通じてエンドエフェクターの衝突回避を保証します。
生成された参照モーションは、堅牢なサブシステムベースの適応コントローラーに入力され、必要なトルクが生成されます。同時に、カッコー探索最適化 (CSO) アルゴリズムが制御ゲインを強化して、定常状態での安定化と追跡誤差を最小限に抑えます。
このアプローチは、不確実性や外乱が存在するにもかかわらず、不慣れな環境において堅牢性と均一な指数収束を保証します。
理論的な主張は、シミュレーション結果の提示を通じて検証されます。

要約(オリジナル)

In robotics, contemporary strategies are learning-based, characterized by a complex black-box nature and a lack of interpretability, which may pose challenges in ensuring stability and safety. To address these issues, we propose integrating a collision-free trajectory planner based on deep reinforcement learning (DRL) with a novel auto-tuning low-level control strategy, all while actively engaging in the learning phase through interactions with the environment. This approach circumvents the control performance and complexities associated with computations while addressing nonrepetitive reaching tasks in the presence of obstacles. First, a model-free DRL agent is employed to plan velocity-bounded motion for a manipulator with ‘n’ degrees of freedom (DoF), ensuring collision avoidance for the end-effector through joint-level reasoning. The generated reference motion is then input into a robust subsystem-based adaptive controller, which produces the necessary torques, while the cuckoo search optimization (CSO) algorithm enhances control gains to minimize the stabilization and tracking error in the steady state. This approach guarantees robustness and uniform exponential convergence in an unfamiliar environment, despite the presence of uncertainties and disturbances. Theoretical assertions are validated through the presentation of simulation outcomes.

arxiv情報

著者 Mehdi Heydari Shahna,Seyed Adel Alizadeh Kolagar,Jouni Mattila
発行日 2024-05-15 07:31:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク