GAPS: Geometry-Aware Problem Solver

要約

幾何学の問題解決は、NLP コミュニティ内で大きな課題となります。
既存のアプローチは、多くの場合、数学の文章題を解くために設計されたモデルに依存し、幾何学の数学問題の固有の特性を無視しています。
さらに、現在の研究は主に幾何学計算問題に焦点を当てており、証明などの他の重要な側面が無視されています。
この研究では、Geometry-Aware 問題ソルバー (GAPS) モデルを提案することで、これらの制限に対処します。
GAPS は、独自の問題タイプ分類器を利用して、さまざまなタイプの幾何学数学問題の解決プログラムを生成するように特別に設計されています。
これを実現するために、GAPS は解プログラムを演算子とオペランドの組み合わせとして扱い、それらの生成プロセスを分離します。
さらに、GAPS の幾何要素を正確に認識する能力を強化する幾何要素強化手法を紹介します。
これらの改善を活用することで、GAPS は幾何学数学の問題の解決において顕著なパフォーマンスを発揮します。
UniGeo データセットに対して行われた実験では、GAPS が最先端のモデルである Geoformer よりも優れていることが実証されました。
具体的には、GAPS は計算タスクでは 5.3% 以上の精度向上を達成し、証明タスクでは 41.1% という驚異的な精度向上を達成しました。
特に、GAPS は証明問題で 97.5% という驚異的な精度を達成しており、幾何学証明タスクの解決における大幅な進歩を示しています。

要約(オリジナル)

Geometry problem solving presents a formidable challenge within the NLP community. Existing approaches often rely on models designed for solving math word problems, neglecting the unique characteristics of geometry math problems. Additionally, the current research predominantly focuses on geometry calculation problems, while overlooking other essential aspects like proving. In this study, we address these limitations by proposing the Geometry-Aware Problem Solver (GAPS) model. GAPS is specifically designed to generate solution programs for geometry math problems of various types with the help of its unique problem-type classifier. To achieve this, GAPS treats the solution program as a composition of operators and operands, segregating their generation processes. Furthermore, we introduce the geometry elements enhancement method, which enhances the ability of GAPS to recognize geometry elements accurately. By leveraging these improvements, GAPS showcases remarkable performance in resolving geometry math problems. Our experiments conducted on the UniGeo dataset demonstrate the superiority of GAPS over the state-of-the-art model, Geoformer. Specifically, GAPS achieves an accuracy improvement of more than 5.3% for calculation tasks and an impressive 41.1% for proving tasks. Notably, GAPS achieves an impressive accuracy of 97.5% on proving problems, representing a significant advancement in solving geometry proving tasks.

arxiv情報

著者 Jiaxin Zhang,Yinghui Jiang,Yashar Moshfeghi
発行日 2024-01-29 16:48:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク