PDSketch: Integrated Planning Domain Programming and Learning

要約

この論文では、柔軟で一般的なロボットの構築に向けたモデル学習とオンライン計画のアプローチを研究します。
具体的には、基礎となる環境遷移モデルの局所性と疎性の構造を活用して、モデルの一般化、データ効率、実行時間効率を向上させる方法を調査します。
PDSketch という名前の新しいドメイン定義言語を紹介します。
これにより、プログラマが TensorFlow や PyTorch を使用して畳み込みニューラル ネットワークのカーネル サイズや隠れ次元を指定するのと同じような方法で、オブジェクトや機能の依存関係など、遷移モデルの高レベルの構造を柔軟に定義できます。
遷移モデルの詳細は、トレーニング可能なニューラル ネットワークによって埋められます。
定義された構造と学習されたパラメーターに基づいて、PDSketch は追加のトレーニングなしでドメインに依存しない計画ヒューリスティックを自動的に生成します。
派生したヒューリスティックにより、新しい目標に向けたパフォーマンス時間の計画が加速されます。

要約(オリジナル)

This paper studies a model learning and online planning approach towards building flexible and general robots. Specifically, we investigate how to exploit the locality and sparsity structures in the underlying environmental transition model to improve model generalization, data-efficiency, and runtime-efficiency. We present a new domain definition language, named PDSketch. It allows users to flexibly define high-level structures in the transition models, such as object and feature dependencies, in a way similar to how programmers use TensorFlow or PyTorch to specify kernel sizes and hidden dimensions of a convolutional neural network. The details of the transition model will be filled in by trainable neural networks. Based on the defined structures and learned parameters, PDSketch automatically generates domain-independent planning heuristics without additional training. The derived heuristics accelerate the performance-time planning for novel goals.

arxiv情報

著者 Jiayuan Mao,Tomás Lozano-Pérez,Joshua B. Tenenbaum,Leslie Pack Kaelbling
発行日 2023-08-24 17:48:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML パーマリンク