要約
ロボットが人間によって発行された自然言語コマンドを理解できることが不可欠です。
このようなコマンドには通常、特定のオブジェクトに対してどのようなアクションを実行するかを示し、多くのオブジェクトに適用できる動詞が含まれています。
動詞を用いて新規オブジェクトに対する操作スキルを一般化する手法を提案する。
私たちのメソッドは、特定のオブジェクトの軌跡が特定の動詞で記述できるかどうかを判断する確率的分類子を学習します。
この分類器は、13 のオブジェクト カテゴリと 14 の動詞にわたって平均 76.69% の精度で新しいオブジェクト カテゴリを正確に一般化することを示します。
次に、オブジェクトの運動学に対してポリシー検索を実行して、特定の動詞の分類子予測を最大化するオブジェクトの軌道を見つけます。
私たちの方法では、ロボットが動詞に基づいて新しいオブジェクトの軌道を生成し、それをモーション プランナーへの入力として使用できます。
私たちのモデルは、実際のロボット上の 2 つの異なるオブジェクト カテゴリの新しいインスタンスに適用される 5 つの動詞コマンドを実行するために使用できる軌道を生成できることを示します。
要約(オリジナル)
It is imperative that robots can understand natural language commands issued by humans. Such commands typically contain verbs that signify what action should be performed on a given object and that are applicable to many objects. We propose a method for generalizing manipulation skills to novel objects using verbs. Our method learns a probabilistic classifier that determines whether a given object trajectory can be described by a specific verb. We show that this classifier accurately generalizes to novel object categories with an average accuracy of 76.69% across 13 object categories and 14 verbs. We then perform policy search over the object kinematics to find an object trajectory that maximizes classifier prediction for a given verb. Our method allows a robot to generate a trajectory for a novel object based on a verb, which can then be used as input to a motion planner. We show that our model can generate trajectories that are usable for executing five verb commands applied to novel instances of two different object categories on a real robot.
arxiv情報
著者 | Rachel Ma,Lyndon Lam,Benjamin A. Spiegel,Aditya Ganeshan,Roma Patel,Ben Abbatematteo,David Paulius,Stefanie Tellex,George Konidaris |
発行日 | 2024-10-18 02:12:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google