Purpose for Open-Ended Learning Robots: A Computational Taxonomy, Definition, and Operationalisation

要約

自律オープンエンド学習 (OEL) ロボットは、たとえば内発的動機や自己生成の目標の導きに依存するなど、環境との直接的な相互作用を通じて、新しいスキルや知識を累積的に獲得することができます。
OEL ロボットは、自律的に取得した知識を使用して人間のユーザーに関連するタスクを実行できるため、アプリケーションとの関連性が高くなります。
しかし、OEL ロボットには重要な制限があります。これにより、ユーザーのタスクを達成するのにあまり関係のない知識を取得してしまう可能性があります。
この研究では、「目的」という新しい概念を中心に、この問題に対する考えられる解決策を分析しています。
目的は、設計者やユーザーがロボットに何を望むかを示します。
ロボットは、目的の内部表現(ここでは「欲望」と呼ぶ)を使用して、目的を達成するために関連する知識の獲得に向けて無制限の探索に焦点を当てる必要があります。
この研究は、2 つの方法で意図的な計算フレームワークの開発に貢献します。
まず、以下を含む 3 レベルの動機階層に基づいて、目的に関するフレームワークを形式化します。(a) 目的。
(b) ドメインに依存しない欲望。
(c) 特定のドメインに依存する状態目標。
第二に、この研究は、「目的と欲望の一致問題」、「目的と目標の根拠付けの問題」、「欲望間の調停」など、フレームワークによって浮き彫りになった重要な課題を強調しています。
全体として、このアプローチにより、OEL ロボットは自律的な方法で学習するだけでなく、設計者とユーザーの目的に合った目標とスキルの習得にも重点を置くことができます。

要約(オリジナル)

Autonomous open-ended learning (OEL) robots are able to cumulatively acquire new skills and knowledge through direct interaction with the environment, for example relying on the guidance of intrinsic motivations and self-generated goals. OEL robots have a high relevance for applications as they can use the autonomously acquired knowledge to accomplish tasks relevant for their human users. OEL robots, however, encounter an important limitation: this may lead to the acquisition of knowledge that is not so much relevant to accomplish the users’ tasks. This work analyses a possible solution to this problem that pivots on the novel concept of `purpose’. Purposes indicate what the designers and/or users want from the robot. The robot should use internal representations of purposes, called here `desires’, to focus its open-ended exploration towards the acquisition of knowledge relevant to accomplish them. This work contributes to develop a computational framework on purpose in two ways. First, it formalises a framework on purpose based on a three-level motivational hierarchy involving: (a) the purposes; (b) the desires, which are domain independent; (c) specific domain dependent state-goals. Second, the work highlights key challenges highlighted by the framework such as: the `purpose-desire alignment problem’, the `purpose-goal grounding problem’, and the `arbitration between desires’. Overall, the approach enables OEL robots to learn in an autonomous way but also to focus on acquiring goals and skills that meet the purposes of the designers and users.

arxiv情報

著者 Gianluca Baldassarre,Richard J. Duro,Emilio Cartoni,Mehdi Khamassi,Alejandro Romero,Vieri Giuliano Santucci
発行日 2024-03-04 22:03:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク