Imperative Learning: A Self-supervised Neural-Symbolic Learning Framework for Robot Autonomy

要約

強化学習や模倣学習などのデータ駆動型の手法は、ロボットの自律性において目覚ましい成功を収めています。
しかし、そのデータ中心の性質により、常に変化する環境にうまく一般化することが依然として妨げられています。
さらに、ロボットタスクのために大規模なデータセットを収集することは、多くの場合非現実的であり、費用がかかります。
これらの課題を克服するために、記号推論の一般化能力を活用して、ロボットの自律性を実現する新しい自己教師ありニューラル記号 (NeSy) 計算フレームワークである命令型学習 (IL) を導入します。
IL のフレームワークは、ニューラル モジュール、推論エンジン、メモリ システムという 3 つの主要コンポーネントで構成されます。
IL を特別な 2 レベル最適化 (BLO) として定式化し、3 つのモジュールにわたる相互学習を可能にします。
これにより、データ駆動型のアプローチに伴うラベル集約型の障害が克服され、論理推論、物理原理、幾何学的解析などに関する記号推論が活用されます。IL のいくつかの最適化手法について説明し、パスを含む 5 つの異なるロボット自律タスクにおけるその有効性を検証します。
計画、ルール誘導、最適制御、ビジュアルオドメトリ、およびマルチロボットルーティング。
さまざまな実験を通じて、IL がロボットの自律性能力を大幅に強化できることを示しており、これがさまざまな領域にわたるさらなる研究を促進することが期待されます。

要約(オリジナル)

Data-driven methods such as reinforcement and imitation learning have achieved remarkable success in robot autonomy. However, their data-centric nature still hinders them from generalizing well to ever-changing environments. Moreover, collecting large datasets for robotic tasks is often impractical and expensive. To overcome these challenges, we introduce a new self-supervised neural-symbolic (NeSy) computational framework, imperative learning (IL), for robot autonomy, leveraging the generalization abilities of symbolic reasoning. The framework of IL consists of three primary components: a neural module, a reasoning engine, and a memory system. We formulate IL as a special bilevel optimization (BLO), which enables reciprocal learning over the three modules. This overcomes the label-intensive obstacles associated with data-driven approaches and takes advantage of symbolic reasoning concerning logical reasoning, physical principles, geometric analysis, etc. We discuss several optimization techniques for IL and verify their effectiveness in five distinct robot autonomy tasks including path planning, rule induction, optimal control, visual odometry, and multi-robot routing. Through various experiments, we show that IL can significantly enhance robot autonomy capabilities and we anticipate that it will catalyze further research across diverse domains.

arxiv情報

著者 Chen Wang,Kaiyi Ji,Junyi Geng,Zhongqiang Ren,Taimeng Fu,Fan Yang,Yifan Guo,Haonan He,Xiangyu Chen,Zitong Zhan,Qiwei Du,Shaoshu Su,Bowen Li,Yuheng Qiu,Yi Du,Qihang Li,Yifan Yang,Xiao Lin,Zhipeng Zhao
発行日 2024-06-23 12:02:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク