Learning-based Control for Tendon-Driven Continuum Robotic Arms

要約

この論文では、深層強化学習 (DRL) を使用した腱駆動連続ロボット (TDCR) の集中位置制御のための学習ベースのアプローチを、特に Sim-to-Real の制御移行ポリシーに焦点を当てて紹介します。
提案された制御方法は、修正転置ヤコビアン (MTJ) 制御戦略を採用しており、そのパラメーターは Deep Deterministic Policy Gradient (DDPG) アルゴリズムを使用して最適に調整されています。
古典的なモデルベースのコントローラーは、連続体ロボット固有の不確実性と非線形ダイナミクスにより、重大な課題に直面しています。
対照的に、モデルフリー制御戦略では、多様な運用シナリオを処理するために効率的なゲイン調整が必要です。
本研究は、最適な適応ゲイン調整システムを統合することにより、モデルベース戦略と同等の性能を有するモデルフリーコントローラーを開発することを目的としています。
シミュレーションと現実世界の実装の両方は、提案された方法が初期条件や操作タスク空間内の経路に依存せずに連続体ロボットの軌道追跡パフォーマンスを大幅に向上させ、タスクフリーのコントローラーを効果的に確立することを示しています。

要約(オリジナル)

This paper presents a learning-based approach for centralized position control of Tendon Driven Continuum Robots (TDCRs) using Deep Reinforcement Learning (DRL), with a particular focus on the Sim-to-Real transfer of control policies. The proposed control method employs the Modified Transpose Jacobian (MTJ) control strategy, with its parameters optimally tuned using the Deep Deterministic Policy Gradient (DDPG) algorithm. Classical model-based controllers encounter significant challenges due to the inherent uncertainties and nonlinear dynamics of continuum robots. In contrast, model-free control strategies require efficient gain-tuning to handle diverse operational scenarios. This research aims to develop a model-free controller with performance comparable to model-based strategies by integrating an optimal adaptive gain-tuning system. Both simulations and real-world implementations demonstrate that the proposed method significantly enhances the trajectory-tracking performance of continuum robots independent of initial conditions and paths within the operational task-space, effectively establishing a task-free controller.

arxiv情報

著者 Nima Maghooli,Omid Mahdizadeh,Mohammad Bajelani,S. Ali A. Moosavian
発行日 2024-12-06 07:46:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク