Simulated Mental Imagery for Robotic Task Planning

要約

ロボット工学におけるタスク計画のための従来の AI 計画手法では、記号的にエンコードされたドメイン記述が必要です。
明確に定義されたシナリオでは強力であり、人間が解釈できる一方で、これを設定するには多大な労力が必要です。
これとは異なり、日常の計画タスクのほとんどは、さまざまな計画ステップの頭の中でのイメージを使用して、人間によって直感的に解決されます。
ここで、限られた実行精度のみが必要な場合には、同じアプローチをロボットにも使用できることを提案します。
現在の研究では、計画のためのシミュレートされた精神的イメージ(SiMIP)と呼ばれる新しいサブシンボリック手法を提案します。これは、「想像した」イメージに対して実行される、知覚、シミュレートされたアクション、成功チェック、および再計画で構成されます。
通常の畳み込みニューラル ネットワークと敵対的生成ネットワークを組み合わせることで、アルゴリズム的に健全な方法で心的イメージに基づく計画を実装できることを示します。
この方法を使用すると、ロボットは、最初に存在するシーンを使用して、シンボリックなドメイン記述なしでアクション プランを生成する機能を獲得します。同時に、代替のサブシンボリック アプローチである深層強化学習とは異なり、プランは人間が解釈可能なままになります。
さまざまなオブジェクトをさまざまなターゲット スロットに正しく配置する必要があるパッキング問題のために、実際のシーンからデータセットを作成します。
このようにして、このアルゴリズムの効率と成功率を定量化できます。

要約(オリジナル)

Traditional AI-planning methods for task planning in robotics require a symbolically encoded domain description. While powerful in well-defined scenarios, as well as human-interpretable, setting this up requires substantial effort. Different from this, most everyday planning tasks are solved by humans intuitively, using mental imagery of the different planning steps. Here we suggest that the same approach can be used for robots, too, in cases which require only limited execution accuracy. In the current study, we propose a novel sub-symbolic method called Simulated Mental Imagery for Planning (SiMIP), which consists of perception, simulated action, success-checking and re-planning performed on ‘imagined’ images. We show that it is possible to implement mental imagery-based planning in an algorithmically sound way by combining regular convolutional neural networks and generative adversarial networks. With this method, the robot acquires the capability to use the initially existing scene to generate action plans without symbolic domain descriptions, while at the same time plans remain human-interpretable, different from deep reinforcement learning, which is an alternative sub-symbolic approach. We create a dataset from real scenes for a packing problem of having to correctly place different objects into different target slots. This way efficiency and success rate of this algorithm could be quantified.

arxiv情報

著者 Shijia Li,Tomas Kulvicius,Minija Tamosiunaite,Florentin Wörgötter
発行日 2023-07-27 08:13:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク