要約
AI 技術を使用した数学文章問題 (MWP) の解決は、ディープ ニューラル ネットワーク (DNN) の成功により、最近大きく進歩しましたが、解決には程遠いです。
私たちは、MWP ソルバーが通常はさまざまな方法で定式化される同じ問題をよりよく理解するには、類推による学習能力が不可欠であると主張します。
ただし、既存の作品のほとんどはショートカット学習を利用して、単一の質問を含むサンプルに基づいて MWP ソルバーをトレーニングします。
多様な質問が欠如しているため、これらの方法は単に浅いヒューリスティックを学習するだけです。
この論文では、多様でありながら一貫した質問/方程式を生成することによって MWP を解決するという最初の試みを行います。
シナリオの説明、質問、方程式 (つまり、答え) を含む典型的な MWP が与えられると、最初にヒューリスティック ルールのグループを介して複数の一貫した方程式を生成します。
次に、それらをシナリオとともに質問ジェネレーターに入力して、対応する多様な質問を取得し、さまざまな質問と方程式を含む新しい MWP を形成します。
最後に、データ フィルターを適用して不合理な MWP を削除し、高品質の拡張された MWP を保持します。
MWP ソルバーの類推学習能力を評価するために、現在のベンチマーク Math23K を拡張して、多様な質問を含む新しい MWP データセット (DiverseMath23K と呼ばれる) を生成します。
広範な実験結果は、私たちの提案した方法が対応する方程式を備えた高品質の多様な質問を生成できることを示しており、Diverse-Math23Kのパフォーマンスの向上にさらにつながります。
コードとデータセットは、https://github.com/zhouzihao501/DiverseMWP から入手できます。
要約(オリジナル)
Solving math word problem (MWP) with AI techniques has recently made great progress with the success of deep neural networks (DNN), but it is far from being solved. We argue that the ability of learning by analogy is essential for an MWP solver to better understand same problems which may typically be formulated in diverse ways. However most existing works exploit the shortcut learning to train MWP solvers simply based on samples with a single question. In lack of diverse questions, these methods merely learn shallow heuristics. In this paper, we make a first attempt to solve MWPs by generating diverse yet consistent questions/equations. Given a typical MWP including the scenario description, question, and equation (i.e., answer), we first generate multiple consistent equations via a group of heuristic rules. We then feed them to a question generator together with the scenario to obtain the corresponding diverse questions, forming a new MWP with a variety of questions and equations. Finally we engage a data filter to remove those unreasonable MWPs, keeping the high-quality augmented ones. To evaluate the ability of learning by analogy for an MWP solver, we generate a new MWP dataset (called DiverseMath23K) with diverse questions by extending the current benchmark Math23K. Extensive experimental results demonstrate that our proposed method can generate high-quality diverse questions with corresponding equations, further leading to performance improvement on Diverse-Math23K. The code and dataset is available at: https://github.com/zhouzihao501/DiverseMWP
arxiv情報
著者 | Zihao Zhou,Maizhen Ning,Qiufeng Wang,Jie Yao,Wei Wang,Xiaowei Huang,Kaizhu Huang |
発行日 | 2023-06-15 11:47:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google