要約
連続体マニピュレータのデータ駆動型制御にはトレーニング用に大量のデータが必要ですが、十分な量のリアルタイム データを生成することはコスト効率が高くありません。
マニピュレーターのランダムな作動も、場合によっては危険な場合があります。
メタ学習は、新しい環境に適応するためにうまく活用されてきました。
そこで本論文ではメタ学習を用いて上記の問題を解決することを試みた。
そのために 2 つのケースを考えます。
まず本論文では、MAML(Model-Agnostic Meta-Learning)を用いたモデルの学習にシミュレーションデータを利用する方法を提案する。
次に、グラデーション ステップを使用して現実世界に適応します。
第二に、シミュレーションモデルが利用できない、または定式化することが難しい場合、CGAN(Conditional Generative adversial network)-MAMLベースの方法を提案します。
モデルは、少量のリアルタイム データとさまざまな負荷条件の拡張データを使用してトレーニングされます。
その後、現実の環境で適応が行われます。
実験により、両方の場合の相対位置誤差は 3% 未満であることが判明しました。
提案されたモデルは、実際の連続体マニピュレータ上で実験的に検証されます。
要約(オリジナル)
Data driven control of a continuum manipulator requires a lot of data for training but generating sufficient amount of real time data is not cost efficient. Random actuation of the manipulator can also be unsafe sometimes. Meta learning has been used successfully to adapt to a new environment. Hence, this paper tries to solve the above mentioned problem using meta learning. We consider two cases for that. First, this paper proposes a method to use simulation data for training the model using MAML(Model-Agnostic Meta-Learning). Then, it adapts to the real world using gradient steps. Secondly,if the simulation model is not available or difficult to formulate, then we propose a CGAN(Conditional Generative adversial network)-MAML based method for it. The model is trained using a small amount of real time data and augmented data for different loading conditions. Then, adaptation is done in the real environment. It has been found out from the experiments that the relative positioning error for both the cases are below 3%. The proposed models are experimentally verified on a real continuum manipulator.
arxiv情報
著者 | Alok Ranjan Sahoo,Pavan Chakraborty |
発行日 | 2024-03-27 11:16:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google