要約
以前の研究では、答えの値の注釈のみを必要とする数学の単語の問題を解くための、教師付きの弱いパラダイムが導入されました。
これらの方法は、正しい値方程式の候補を疑似ラベルとして検索しますが、膨大な方程式空間の狭い部分空間を検索します。
この問題に対処するために、組み合わせ戦略\textbf{ComSearch}を備えた新しい検索アルゴリズムを提案します。これは、数学的に同等の方程式を除外することで検索空間を圧縮できます。
圧縮により、検索アルゴリズムは可能なすべての方程式を列挙し、高品質のデータを取得できます。
\textit{false-matching} 問題と呼ばれる、間違った数学的論理を持つ疑似ラベルのノイズを調査し、疑似ラベルのノイズを除去するランキング モデルを提案します。
私たちのアプローチは、2 つの既存の教師あり数学単語問題ソルバーを利用して疑似ラベルをトレーニングするための柔軟なフレームワークを保持し、両方とも弱い教師タスクで最先端のパフォーマンスを達成します。
要約(オリジナル)
Previous studies have introduced a weakly-supervised paradigm for solving math word problems requiring only the answer value annotation. While these methods search for correct value equation candidates as pseudo labels, they search among a narrow sub-space of the enormous equation space. To address this problem, we propose a novel search algorithm with combinatorial strategy \textbf{ComSearch}, which can compress the search space by excluding mathematically equivalent equations. The compression allows the searching algorithm to enumerate all possible equations and obtain high-quality data. We investigate the noise in the pseudo labels that hold wrong mathematical logic, which we refer to as the \textit{false-matching} problem, and propose a ranking model to denoise the pseudo labels. Our approach holds a flexible framework to utilize two existing supervised math word problem solvers to train pseudo labels, and both achieve state-of-the-art performance in the weak supervision task.
arxiv情報
著者 | Qianying Liu,Wenyu Guan,Jianhao Shen,Fei Cheng,Sadao Kurohashi |
発行日 | 2023-03-07 12:01:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google