Towards Teachable Autotelic Agents

要約

自律的な発見と直接的な指導は、子どもたちの学習の 2 つの異なるソースですが、教育科学は、補助的な発見やガイド付きの遊びなどの混合アプローチがスキルの習得を改善することを示しています。
人工知能の分野では、これらの極限はそれぞれ、独自の信号から学習する自律エージェントと、教師によって完全に教えられる対話型学習エージェントにマッピングされます。
その中間にあるのが、教育可能なオートテリック エージェント (TAA) です。エージェントは、内部信号と教育信号の両方から学習して、発見支援の効率性を高めます。
このようなエージェントを設計することで、現実世界の専門家ではないユーザーが、エージェントの学習軌跡を期待に沿って方向付けることができます。
より根本的には、これは人間レベルの知性を持つエージェントを構築するための重要なステップでもあります。
この論文では、教育可能な自律エージェントの設計に向けたロードマップを提示します。
発達心理学と教育科学に基づいて、私たちは、子供と家庭教師の相互作用における支援された発見プロセスを可能にする重要な機能を特定することから始めます。
これは、将来の TAA が実証する必要がある機能のチェックリストの作成につながります。
チェックリストにより、現在の強化学習エージェントのさまざまな制限を正確に特定し、TAA への有望な最初のステップを特定することができます。
また、自然教育を通じて一般の人々が教えることができる設計または自律エージェントに向けた重要な研究の方向性を強調することにより、今後の道筋も示しています。

要約(オリジナル)

Autonomous discovery and direct instruction are two distinct sources of learning in children but education sciences demonstrate that mixed approaches such as assisted discovery or guided play result in improved skill acquisition. In the field of Artificial Intelligence, these extremes respectively map to autonomous agents learning from their own signals and interactive learning agents fully taught by their teachers. In between should stand teachable autotelic agents (TAA): agents that learn from both internal and teaching signals to benefit from the higher efficiency of assisted discovery. Designing such agents will enable real-world non-expert users to orient the learning trajectories of agents towards their expectations. More fundamentally, this may also be a key step to build agents with human-level intelligence. This paper presents a roadmap towards the design of teachable autonomous agents. Building on developmental psychology and education sciences, we start by identifying key features enabling assisted discovery processes in child-tutor interactions. This leads to the production of a checklist of features that future TAA will need to demonstrate. The checklist allows us to precisely pinpoint the various limitations of current reinforcement learning agents and to identify the promising first steps towards TAA. It also shows the way forward by highlighting key research directions towards the design or autonomous agents that can be taught by ordinary people via natural pedagogy.

arxiv情報

著者 Olivier Sigaud,Ahmed Akakzia,Hugo Caselles-Dupré,Cédric Colas,Pierre-Yves Oudeyer,Mohamed Chetouani
発行日 2023-03-20 15:24:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク