Constrained Behavior Cloning for Robotic Learning

要約

行動クローニング (BC) は、ロボット工学や自動運転などの社会で人気のある教師付き模倣学習方法であり、専門家のデモンストレーションから直接模倣することで複雑なスキルを学習できます。
急速な発展にもかかわらず、センサーや関節ノイズの蓄積によりエラーが複合化するという限られた視野の影響を依然として受けています。
この論文では、神経科学者に触発された高レベルの状態情報を主に考慮するために、幾何学的および歴史的に制約された行動のクローニング (GHCBC) を導入しました。幾何学的に制約された行動のクローニングは、予測ポーズを幾何学的に制約するために使用され、歴史的に制約された行動のクローニングは、
アクションシーケンスを時間的に制限します。
これら 2 種類の制約間の相乗効果により、堅牢性と安定性の点で BC パフォーマンスが向上しました。
総合的な実験結果では、最先端のBC手法と比較して、特に長期運用シーンにおいて、シミュレーションでの成功率が平均29.73%、実際のロボット実験での成功率が39.4%向上したことが示され、大きな可能性を示しています。
ロボット学習に GHCBC を使用します。

要約(オリジナル)

Behavior cloning (BC) is a popular supervised imitation learning method in the societies of robotics, autonomous driving, etc., wherein complex skills can be learned by direct imitation from expert demonstrations. Despite its rapid development, it is still affected by limited field of view where accumulation of sensors and joint noise bring compounding errors. In this paper, we introduced geometrically and historically constrained behavior cloning (GHCBC) to dominantly consider high-level state information inspired by neuroscientists, wherein the geometrically constrained behavior cloning were used to geometrically constrain predicting poses, and the historically constrained behavior cloning were utilized to temporally constrain action sequences. The synergy between these two types of constrains enhanced the BC performance in terms of robustness and stability. Comprehensive experimental results showed that success rates were improved by 29.73% in simulation and 39.4% in real robot experiments in average, respectively, compared to state-of-the-art BC method, especially in long-term operational scenes, indicating great potential of using the GHCBC for robotic learning.

arxiv情報

著者 Wensheng Liang,Jun Xie,Zhicheng Wang,Jianwei Tan,Xiaoguang Ma
発行日 2024-08-20 06:15:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク