GOLD: Geometry Problem Solver with Natural Language Description

要約

人工知能 (AI) における自動化された幾何数学の問題解決の課題に対処するには、マルチモーダルな情報と数学を理解する必要があります。
現在の方法では、幾何学図を正確に解釈するのが難しく、効果的な問題解決が妨げられています。
この問題に取り組むために、自然言語記述 (GOLD) モデルを使用した幾何学問題解決策を提示します。
GOLD は、図内のシンボルと幾何プリミティブを個別に処理することにより、幾何関係の抽出を強化します。
その後、抽出された関係を自然言語記述に変換し、大規模な言語モデルを効率的に利用して幾何数学の問題を解決します。
実験の結果、GOLD モデルは、計算とサブセットの証明において 12.7% と 42.1% の精度向上を達成し、UniGeo データセットに対するこれまでの最良の方法である Geoformer モデルを上回るパフォーマンスを示しました。
さらに、PGPS9K および Geometry3K データセットの以前の最高のモデルである PGPSNet を上回り、それぞれ 1.8% と 3.2% の精度向上が得られています。

要約(オリジナル)

Addressing the challenge of automated geometry math problem-solving in artificial intelligence (AI) involves understanding multi-modal information and mathematics. Current methods struggle with accurately interpreting geometry diagrams, which hinders effective problem-solving. To tackle this issue, we present the Geometry problem sOlver with natural Language Description (GOLD) model. GOLD enhances the extraction of geometric relations by separately processing symbols and geometric primitives within the diagram. Subsequently, it converts the extracted relations into natural language descriptions, efficiently utilizing large language models to solve geometry math problems. Experiments show that the GOLD model outperforms the Geoformer model, the previous best method on the UniGeo dataset, by achieving accuracy improvements of 12.7% and 42.1% in calculation and proving subsets. Additionally, it surpasses the former best model on the PGPS9K and Geometry3K datasets, PGPSNet, by obtaining accuracy enhancements of 1.8% and 3.2%, respectively.

arxiv情報

著者 Jiaxin Zhang,Yashar Moshfeghi
発行日 2024-05-01 13:00:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク