Can neural networks do arithmetic? A survey on the elementary numerical skills of state-of-the-art deep learning models

要約

高度な推論スキルを発揮できる学習モデルを作成することは、深層学習研究における最大の課題の 1 つであり、数学はこの方向における科学の進歩を評価するための対象領域の 1 つになりつつあります。
ここ数年、数学的問題に取り組むために特別に設計されたニューラル ネットワーク アーキテクチャ、データ セット、ベンチマークが急増しており、自動定理証明、数値積分、新しい予想や行列乗算の発見など、さまざまな分野で顕著な成功が報告されています。
アルゴリズム。
しかし、これらの目覚ましい成果にもかかわらず、深層学習モデルが量と記号数の初歩的な理解を持っているかどうかはまだ不明です。
この調査では、最近の文献を批判的に調べ、基本的な数値および算術知識をテストするように設計された比較的単純なタスクで調べると、最先端のアーキテクチャでさえ不十分であることが多いと結論付けています。

要約(オリジナル)

Creating learning models that can exhibit sophisticated reasoning skills is one of the greatest challenges in deep learning research, and mathematics is rapidly becoming one of the target domains for assessing scientific progress in this direction. In the past few years there has been an explosion of neural network architectures, data sets, and benchmarks specifically designed to tackle mathematical problems, reporting notable success in disparate fields such as automated theorem proving, numerical integration, and discovery of new conjectures or matrix multiplication algorithms. However, despite these impressive achievements it is still unclear whether deep learning models possess an elementary understanding of quantities and symbolic numbers. In this survey we critically examine the recent literature, concluding that even state-of-the-art architectures often fall short when probed with relatively simple tasks designed to test basic numerical and arithmetic knowledge.

arxiv情報

著者 Alberto Testolin
発行日 2023-03-14 09:30:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク