An Empirical Study on Challenging Math Problem Solving with GPT-4

要約

大規模言語モデル(LLM)を用いて数学的問題に取り組むことは、多くの科学・工学分野で自然言語で表現される数学問題の多さを考慮すると、興味深い研究課題である。LLMを用いた初等的な数学の解法についてはいくつかの先行研究があるが、本研究では、より複雑で難しい数学の問題を解くためにGPT-4を用いるというフロンティアを探求している。GPT-4を使用する様々な方法を評価する。その中には、既存の研究成果を応用したものもあれば、本研究で新たに提案した会話型問題解決フレームワークである「ΜMathChat」もある。MATHデータセットの難しい高校生の競技問題で評価を行い、提案した会話型アプローチの優位性を示しました。

要約(オリジナル)

Employing Large Language Models (LLMs) to address mathematical problems is an intriguing research endeavor, considering the abundance of math problems expressed in natural language across numerous science and engineering fields. While several prior works have investigated solving elementary mathematics using LLMs, this work explores the frontier of using GPT-4 for solving more complex and challenging math problems. We evaluate various ways of using GPT-4. Some of them are adapted from existing work, and one is \MathChat, a conversational problem-solving framework newly proposed in this work. We perform the evaluation on difficult high school competition problems from the MATH dataset, which shows the advantage of the proposed conversational approach.

arxiv情報

著者 Yiran Wu,Feiran Jia,Shaokun Zhang,Qingyun Wu,Hangyu Li,Erkang Zhu,Yue Wang,Yin Tat Lee,Richard Peng,Chi Wang
発行日 2023-06-02 08:02:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, stat.ML パーマリンク