Meta-Referential Games to Learn Compositional Learning Behaviours

要約

人間は構成性を利用して、過去の経験から新しい経験を一般化します。
私たちは、私たちの経験を基本的な原子コンポーネントに分離し、新しい方法で再結合して、新しい経験に取り組む能力をサポートできると想定しています。
私たちはこれを、構成的に一般化することを学ぶ能力として枠組み付けし、この能力を利用する行動を構成的学習行動 (CLB) と呼びます。
CLB を学習する際の中心的な問題は、結合問題 (BP) の解決です。
これも人間が容易に実行できる知性の偉業ですが、最先端の人工エージェントには当てはまりません。
したがって、人間と協力できる人工エージェントを構築するために、ドメインに依存しないバージョンの BP を解くことによって CLB を示すエージェントの能力を調査するための新しいベンチマークを開発することを提案します。
私たちは言語の創発と参照ゲームのグラウンディング フレームワークからインスピレーションを得て、メタ参照ゲームと題された参照ゲームのメタ学習拡張を提案し、このフレームワークを使用してベンチマークを構築し、それを記号的行動ベンチマーク (S2B) と名付けます。
私たちは、ベンチマークが説得力のある課題であることを示すベースライン結果を提供し、より有能な人工薬剤の開発に向けて研究コミュニティを刺激することを期待しています。

要約(オリジナル)

Human beings use compositionality to generalise from past experiences to novel experiences. We assume a separation of our experiences into fundamental atomic components that can be recombined in novel ways to support our ability to engage with novel experiences. We frame this as the ability to learn to generalise compositionally, and we will refer to behaviours making use of this ability as compositional learning behaviours (CLBs). A central problem to learning CLBs is the resolution of a binding problem (BP). While it is another feat of intelligence that human beings perform with ease, it is not the case for state-of-the-art artificial agents. Thus, in order to build artificial agents able to collaborate with human beings, we propose to develop a novel benchmark to investigate agents’ abilities to exhibit CLBs by solving a domain-agnostic version of the BP. We take inspiration from the language emergence and grounding framework of referential games and propose a meta-learning extension of referential games, entitled Meta-Referential Games, and use this framework to build our benchmark, that we name Symbolic Behaviour Benchmark (S2B). We provide baseline results showing that our benchmark is a compelling challenge that we hope will spur the research community towards developing more capable artificial agents.

arxiv情報

著者 Kevin Denamganaï,Sondess Missaoui,James Alfred Walker
発行日 2023-07-25 14:30:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク