Can language models learn analogical reasoning? Investigating training objectives and comparisons to human performance

要約

類推はNLPにおいて単語埋め込みを評価する一般的な方法であるが、類推自体が学習可能なタスクであるかどうかを調べることも興味深い。本論文では、基本的な類推を学習するいくつかの方法をテストし、特に、一般的に使用されるNLPベンチマークのものよりも、人間の類推評価に使用される典型的な類推に焦点を当てる。我々の実験では、モデルが少ないデータ量でも類推を学習できることを発見した。さらに、我々のモデルを人間のベースラインを持つデータセットと比較し、訓練後、モデルが人間の性能に近づくことを見出した。

要約(オリジナル)

While analogies are a common way to evaluate word embeddings in NLP, it is also of interest to investigate whether or not analogical reasoning is a task in itself that can be learned. In this paper, we test several ways to learn basic analogical reasoning, specifically focusing on analogies that are more typical of what is used to evaluate analogical reasoning in humans than those in commonly used NLP benchmarks. Our experiments find that models are able to learn analogical reasoning, even with a small amount of data. We additionally compare our models to a dataset with a human baseline, and find that after training, models approach human performance.

arxiv情報

著者 Molly R. Petersen,Lonneke van der Plas
発行日 2024-05-03 10:22:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク