要約
ロボットは、物体を正確にシミュレートするために、観察から物体の材質と動的特性を推定する必要があります。
一連の観察に基づいてオブジェクトの材料特性パラメーターを特定するためのベイズ最適化アプローチを紹介します。
私たちの焦点は、相互作用するオブジェクトのさまざまなセットを含むシーンの観察に基づいて、これらのプロパティを推定することにあります。
私たちは、各観測の報酬を個別にモデル化し、そのシーン内のオブジェクトのパラメーターのみを入力として使用することにより、報酬関数の構造を利用するアプローチを提案します。
結果として得られる低次元モデルはパラメーター空間全体にわたってより適切に一般化され、その結果、より高速な最適化が実現します。
最適化プロセスをさらに高速化し、適切なパラメーター値を見つけるために必要なシミュレーションの実行回数を減らすために、選択されたパラメーターが現実世界の評価のサブセットでのみ評価される、報酬関数の部分評価も提案します。
このアプローチは、幅広いオブジェクト インタラクションを伴う一連のシーンで正常に評価され、収集された観察の報酬をリセットすることなく、この方法が効果的に増分学習を実行できることを示しました。
要約(オリジナル)
Robots need to estimate the material and dynamic properties of objects from observations in order to simulate them accurately. We present a Bayesian optimization approach to identifying the material property parameters of objects based on a set of observations. Our focus is on estimating these properties based on observations of scenes with different sets of interacting objects. We propose an approach that exploits the structure of the reward function by modeling the reward for each observation separately and using only the parameters of the objects in that scene as inputs. The resulting lower-dimensional models generalize better over the parameter space, which in turn results in a faster optimization. To speed up the optimization process further, and reduce the number of simulation runs needed to find good parameter values, we also propose partial evaluations of the reward function, wherein the selected parameters are only evaluated on a subset of real world evaluations. The approach was successfully evaluated on a set of scenes with a wide range of object interactions, and we showed that our method can effectively perform incremental learning without resetting the rewards of the gathered observations.
arxiv情報
著者 | M. Yunus Seker,Oliver Kroemer |
発行日 | 2023-10-18 07:16:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google