Adaptive Terminal Sliding Mode Control Using Deep Reinforcement Learning for Zero-Force Control of Exoskeleton Robot Systems

要約

本稿では、リハビリテーション、介助、人間の身体能力向上など、さまざまな用途に使用される上肢外骨格ロボットの新しいゼロフォース制御手法を紹介します。
提案された制御方法は、適応積分端末スライディング モード (AITSM) コントローラーを採用し、指数関数的到達則と深層強化学習 (DRL) の一種である近接ポリシー最適化 (PPO) を組み合わせます。
PPO システムには、アテンション メカニズムと長期短期記憶 (LSTM) ニューラル ネットワークが組み込まれており、コントローラーが関連するシステム状態に選択的に焦点を当て、変化する動作に適応し、長期的な依存関係をキャプチャできるようになります。
このコントローラーは、システムの不確実性の中でも、ゼロ力で 5 自由度の上肢外骨格ロボットを管理できるように設計されています。
コントローラは一体型の端子スライド面を使用して、目的の状態への有限時間収束を保証します。これは、迅速な応答が必要なアプリケーションにとって重要な機能です。
また、チャタリングを低減し、システムの精度を向上させるための指数スイッチング制御項も含まれています。
PPO システムによって促進されるコントローラーの適応性により、システムのフィードバックに基づいてリアルタイムのパラメーター調整が可能になり、コントローラーが堅牢になり、外骨格のパフォーマンスに影響を与える可能性のある不確実性や外乱に対処できるようになります。
提案した制御手法の有効性と優位性を数値シミュレーションや既存制御手法との比較により確認する。

要約(オリジナル)

This paper introduces a novel zero-force control method for upper-limb exoskeleton robots, which are used in a variety of applications including rehabilitation, assistance, and human physical capability enhancement. The proposed control method employs an Adaptive Integral Terminal Sliding Mode (AITSM) controller, combined with an exponential reaching law and Proximal Policy Optimization (PPO), a type of Deep Reinforcement Learning (DRL). The PPO system incorporates an attention mechanism and Long Short-Term Memory (LSTM) neural networks, enabling the controller to selectively focus on relevant system states, adapt to changing behavior, and capture long-term dependencies. This controller is designed to manage a 5-DOF upper-limb exoskeleton robot with zero force, even amidst system uncertainties. The controller uses an integral terminal sliding surface to ensure finite-time convergence to the desired state, a crucial feature for applications requiring quick responses. It also includes an exponential switching control term to reduce chattering and improve system accuracy. The controller’s adaptability, facilitated by the PPO system, allows real-time parameter adjustments based on system feedback, making the controller robust and capable of dealing with uncertainties and disturbances that could affect the performance of the exoskeleton. The proposed control method’s effectiveness and superiority are confirmed through numerical simulations and comparisons with existing control methods.

arxiv情報

著者 Morteza Mirzaee,Reza Kazemi
発行日 2024-07-25 18:01:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク