Error-Feedback Model for Output Correction in Bilateral Control-Based Imitation Learning

要約

近年、ニューラルネットワークを用いた模倣学習により、ロボットは柔軟なタスクを実行できるようになりました。
ただし、ニューラル ネットワークはフィードフォワード構造で動作するため、出力エラーを補償するメカニズムを備えていません。
この制限に対処するために、これらのエラーを修正するフィードバック メカニズムを開発しました。
ニューラルネットワークを下位層と上位層からなる階層構造にすることで、下位層が上位層に追従するように制御した。
さらに、内部状態を持たない下位層で多層パーセプトロンを使用することで、エラー フィードバックが強化されました。
文字を書くタスクでは、このモデルは、以前に訓練されていない文字を書く際の精度の向上を実証しました。
文字を書くタスクでは、このモデルは、以前に訓練されていない文字を書く際の精度の向上を実証しました。
誤差フィードバックによる自律制御により、下位層が上位層の出力を効果的に追従できることを確認しました。
この研究は、ニューラル ネットワークと制御理論の統合に向けた有望な一歩を示しています。

要約(オリジナル)

In recent years, imitation learning using neural networks has enabled robots to perform flexible tasks. However, since neural networks operate in a feedforward structure, they do not possess a mechanism to compensate for output errors. To address this limitation, we developed a feedback mechanism to correct these errors. By employing a hierarchical structure for neural networks comprising lower and upper layers, the lower layer was controlled to follow the upper layer. Additionally, using a multi-layer perceptron in the lower layer, which lacks an internal state, enhanced the error feedback. In the character-writing task, this model demonstrated improved accuracy in writing previously untrained characters. In the character-writing task, this model demonstrated improved accuracy in writing previously untrained characters. Through autonomous control with error feedback, we confirmed that the lower layer could effectively track the output of the upper layer. This study represents a promising step toward integrating neural networks with control theories.

arxiv情報

著者 Hiroshi Sato,Masashi Konosu,Sho Sakaino,Toshiaki Tsuji
発行日 2024-11-19 06:09:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク