A Soft Robotic System Automatically Learns Precise Agile Motions Without Model Information


医療や製造業など多くの応用領域において、空気圧を利用したソフトロボット(SR)は大きなメリットをもたらす。しかし、SRの正確な制御は、主にその非線形ダイナミクスと粘弾性材料特性のために、今日まで重要な課題として残されている。従来の制御設計手法では、複雑なシステムモデリングや時間のかかる手動チューニングに頼ることが多く、いずれも人間の専門知識を必要とするため、実用性に限界がありました。最近の研究では、データ駆動型手法であるAutomatic Neural ODE Control (ANODEC)を用いて、様々な非線形システムの制御器を、入出力データのみを用いて、完全自動で、しかも事前のモデル知識や大規模な手動チューニングを必要とせずに、インシリコで設計することに成功している。本研究では、ANODECを応用し、実世界のSRにおいて、有限時間地平線の中で、俊敏で反復性のない基準追従運動タスクを自動的に学習することに成功した。筆者らの知る限り、ANODECはヒステリシス効果を持つSRを、わずか30秒間の入出力データから、事前のモデル知識なしに、初めて高性能に制御することに成功した。複数の、質的に異なる、さらには訓練分布外の基準信号に対しても、ANODECによって設計された単一のフィードバック制御器が、手動でチューニングされたPIDベースラインを一貫して上回ることを示す。全体として、この貢献はANODECの妥当性をさらに強化するだけでなく、最小限の実験的相互作用時間から機敏な動作を自動的に学習できる、より実用的で使いやすいSRに向けた重要な一歩となる。


Many application domains, e.g., in medicine and manufacturing, can greatly benefit from pneumatic Soft Robots (SRs). However, the accurate control of SRs has remained a significant challenge to date, mainly due to their nonlinear dynamics and viscoelastic material properties. Conventional control design methods often rely on either complex system modeling or time-intensive manual tuning, both of which require significant amounts of human expertise and thus limit their practicality. In recent works, the data-driven method, Automatic Neural ODE Control (ANODEC) has been successfully used to — fully automatically and utilizing only input-output data — design controllers for various nonlinear systems in silico, and without requiring prior model knowledge or extensive manual tuning. In this work, we successfully apply ANODEC to automatically learn to perform agile, non-repetitive reference tracking motion tasks in a real-world SR and within a finite time horizon. To the best of the authors’ knowledge, ANODEC achieves, for the first time, performant control of a SR with hysteresis effects from only 30 seconds of input-output data and without any prior model knowledge. We show that for multiple, qualitatively different and even out-of-training-distribution reference signals, a single feedback controller designed by ANODEC outperforms a manually tuned PID baseline consistently. Overall, this contribution not only further strengthens the validity of ANODEC, but it marks an important step towards more practical, easy-to-use SRs that can automatically learn to perform agile motions from minimal experimental interaction time.


著者 Simon Bachhuber,Alexander Pawluchin,Arka Pal,Ivo Boblan,Thomas Seel
発行日 2024-09-02 14:11:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク