Models Can and Should Embrace the Communicative Nature of Human-Generated Math

要約

数学は人々によって人々のために構築されます。自然言語コーパスが命題だけでなく言語使用者のコミュニケーション目標を反映するのと同じように、モデルがトレーニングされる数学データは、理想化された数学的実体だけでなく、豊かなコミュニケーションの意図を反映します。
数学を純粋に記号的な方法で扱うことには重要な利点がありますが、ここでは、数学を状況に応じた言語コミュニケーションとして扱うことには利点があり、言語モデルは十分には評価されていない方法でこの目標に適しているという仮説を立てます。
これらの点を 2 つのケーススタディで説明します。
まず、実験を行ったところ、言語モデルは人間のような方法で等号を解釈し、異なる方法で配置された同じ基礎となる方程式に対して体系的に異なる文章題を生成することがわかりました。
第二に、たとえ他の順序が論理的に同等であっても、言語モデルは自然主義的な方法で証明を順序付けることを好むことがわかりました。
私たちは、人間が生成した数学に潜在するコミュニケーション意図から学習し、それを表現する AI システムを提唱します。

要約(オリジナル)

Math is constructed by people for people: just as natural language corpora reflect not just propositions but the communicative goals of language users, the math data that models are trained on reflects not just idealized mathematical entities but rich communicative intentions. While there are important advantages to treating math in a purely symbolic manner, we here hypothesize that there are benefits to treating math as situated linguistic communication and that language models are well suited for this goal, in ways that are not fully appreciated. We illustrate these points with two case studies. First, we ran an experiment in which we found that language models interpret the equals sign in a humanlike way — generating systematically different word problems for the same underlying equation arranged in different ways. Second, we found that language models prefer proofs to be ordered in naturalistic ways, even though other orders would be logically equivalent. We advocate for AI systems that learn from and represent the communicative intentions latent in human-generated math.

arxiv情報

著者 Sasha Boguraev,Ben Lipkin,Leonie Weissweiler,Kyle Mahowald
発行日 2024-09-25 15:08:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク