A Number Sense as an Emergent Property of the Manipulating Brain

要約

人工知能 (AI) システムは、トレーニング データを超えて一般化し、トレーニング サンプルの詳細から一般プロパティを抽象化するのに苦労しています。
私たちは、教師なしの日常経験を通じて数の感覚を思いつく人間の見かけの能力を再現するモデルを提案します。
数字や量を理解し、操作する能力は幼少期に現れますが、人間がこの能力を獲得し、発達させるメカニズムはまだよくわかっていません。
特に、そのような数字の感覚を身につけることが教師の指導なしで可能であるかどうかは不明です。
私たちは、学習者が小さな物体を選んで配置することができ、自発的に方向のない操作に取り組むことを前提として、モデルを通じてこの質問を調査します。
私たちは、学習者の視覚システムがシーン内のオブジェクトの配置の変化を監視し、知覚と運動システムの遠心性信号を比較することによって各アクションの影響を予測することを学習すると仮定します。
特徴の抽出と分類に標準のディープネットワークを使用して知覚をモデル化します。
私たちは、行動予測という無関係なタスクを学習することで、数字の認識と表現を予見する規則性を示す予期せぬ画像表現が出現することを発見しました。
これらには、最初のいくつかの自然数の個別のカテゴリ、数値の厳密な順序、および数値量と相関する 1 次元信号が含まれます。
その結果、私たちのモデルは数を推定し、サブタイズする機能を獲得しました。
注目すべきことに、部分化と数の推定は、トレーニング中に使用される 3 つのオブジェクトをはるかに超えて、多くのオブジェクトを含むシーンを推定します。
私たちは、数と量に関する施設の重要な側面は教師の監督なしで学習できると結論付けています。

要約(オリジナル)

Artificial intelligence (AI) systems struggle to generalize beyond their training data and abstract general properties from the specifics of the training examples. We propose a model that reproduces the apparent human ability to come up with a number sense through unsupervised everyday experience. The ability to understand and manipulate numbers and quantities emerges during childhood, but the mechanism through which humans acquire and develop this ability is still poorly understood. In particular, it is not known whether acquiring such a number sense is possible without supervision from a teacher. We explore this question through a model, assuming that the learner is able to pick and place small objects and will spontaneously engage in undirected manipulation. We assume that the learner’s visual system will monitor the changing arrangements of objects in the scene and will learn to predict the effects of each action by comparing perception with the efferent signal of the motor system. We model perception using standard deep networks for feature extraction and classification. We find that, from learning the unrelated task of action prediction, an unexpected image representation emerges exhibiting regularities that foreshadow the perception and representation of numbers. These include distinct categories for the first few natural numbers, a strict ordering of the numbers, and a one-dimensional signal that correlates with numerical quantity. As a result, our model acquires the ability to estimate numerosity and subitize. Remarkably, subitization and numerosity estimation extrapolate to scenes containing many objects, far beyond the three objects used during training. We conclude that important aspects of a facility with numbers and quantities may be learned without teacher supervision.

arxiv情報

著者 Neehar Kondapaneni,Pietro Perona
発行日 2023-11-09 02:49:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO, q-bio.NC パーマリンク