A Soft Robotic System Automatically Learns Precise Agile Motions Without Model Information

要約

医療や製造などの多くの応用分野は、空気圧ソフト ロボット (SR) から大きな恩恵を受けることができます。
しかし、主に SR の非線形力学と粘弾性材料特性により、SR の正確な制御は依然として大きな課題となっています。
従来の制御設計手法は、複雑なシステム モデリングや時間のかかる手動チューニングに依存することが多く、どちらも人間の専門知識を大量に必要とするため、実用性が限られています。
最近の研究では、データ駆動型手法である自動ニューラル ODE 制御 (ANODEC) を使用して、完全に自動で入出力データのみを利用して、事前のモデル知識を必要とせずにさまざまな非線形システムのコントローラーをコンピュータで設計することに成功しました。
または広範囲にわたる手動チューニング。
この研究では、ANODEC を適用して、現実世界の SR 内で有限の時間枠内で機敏で非反復的なリファレンス追跡モーション タスクを実行する方法を自動的に学習することに成功しました。
著者の知る限り、ANODEC は、事前のモデル知識なしで、わずか 30 秒の入出力データからヒステリシス効果を備えた SR の高性能制御を初めて達成しました。
質的に異なる、さらにはトレーニング分布外の複数の基準信号に対して、ANODEC によって設計された単一のフィードバック コントローラーが、手動で調整された PID ベースラインよりも一貫して優れたパフォーマンスを発揮することを示します。
全体として、この貢献は ANODEC の有効性をさらに強化するだけでなく、最小限の実験インタラクション時間から機敏なモーションの実行を自動的に学習できる、より実用的で使いやすい SR に向けた重要な一歩を示しています。

要約(オリジナル)

Many application domains, e.g., in medicine and manufacturing, can greatly benefit from pneumatic Soft Robots (SRs). However, the accurate control of SRs has remained a significant challenge to date, mainly due to their nonlinear dynamics and viscoelastic material properties. Conventional control design methods often rely on either complex system modeling or time-intensive manual tuning, both of which require significant amounts of human expertise and thus limit their practicality. In recent works, the data-driven method, Automatic Neural ODE Control (ANODEC) has been successfully used to — fully automatically and utilizing only input-output data — design controllers for various nonlinear systems in silico, and without requiring prior model knowledge or extensive manual tuning. In this work, we successfully apply ANODEC to automatically learn to perform agile, non-repetitive reference tracking motion tasks in a real-world SR and within a finite time horizon. To the best of the authors’ knowledge, ANODEC achieves, for the first time, performant control of a SR with hysteresis effects from only 30 seconds of input-output data and without any prior model knowledge. We show that for multiple, qualitatively different and even out-of-training-distribution reference signals, a single feedback controller designed by ANODEC outperforms a manually tuned PID baseline consistently. Overall, this contribution not only further strengthens the validity of ANODEC, but it marks an important step towards more practical, easy-to-use SRs that can automatically learn to perform agile motions from minimal experimental interaction time.

arxiv情報

著者 Simon Bachhuber,Alexander Pawluchin,Arka Pal,Ivo Boblan,Thomas Seel
発行日 2024-08-12 11:15:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク