PDSketch: Integrated Planning Domain Programming and Learning

要約

この論文では、柔軟で一般的なロボットの構築に向けたモデル学習とオンライン計画アプローチを研究しています。
具体的には、モデルの一般化、データ効率、実行効率を改善するために、基礎となる環境遷移モデルの局所性と希薄構造を活用する方法を調査します。
PDSketch という名前の新しいドメイン定義言語を紹介します。
ユーザーは、プログラマーが TensorFlow や PyTorch を使用して畳み込みニューラル ネットワークのカーネル サイズと隠れた次元を指定する方法と同様の方法で、オブジェクトや機能の依存関係など、遷移モデルの高レベル構造を柔軟に定義できます。
遷移モデルの詳細は、トレーニング可能なニューラル ネットワークによって埋められます。
定義された構造と学習したパラメーターに基づいて、PDSketch はドメインに依存しない計画ヒューリスティックを追加のトレーニングなしで自動的に生成します。
導出されたヒューリスティックは、新しい目標のパフォーマンス時間計画を加速します。

要約(オリジナル)

This paper studies a model learning and online planning approach towards building flexible and general robots. Specifically, we investigate how to exploit the locality and sparsity structures in the underlying environmental transition model to improve model generalization, data-efficiency, and runtime-efficiency. We present a new domain definition language, named PDSketch. It allows users to flexibly define high-level structures in the transition models, such as object and feature dependencies, in a way similar to how programmers use TensorFlow or PyTorch to specify kernel sizes and hidden dimensions of a convolutional neural network. The details of the transition model will be filled in by trainable neural networks. Based on the defined structures and learned parameters, PDSketch automatically generates domain-independent planning heuristics without additional training. The derived heuristics accelerate the performance-time planning for novel goals.

arxiv情報

著者 Jiayuan Mao,Tomás Lozano-Pérez,Joshua B. Tenenbaum,Leslie Pack Kaelbling
発行日 2023-03-09 18:54:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML パーマリンク