Comparing scalable strategies for generating numerical perspectives

要約

数値的な視点は、極端で見慣れない数値を理解するのに役立つ(例えば、⽶国では、⽶国3,300億ドルは⼀⼈当たり約⽶国1,000ドル)。研究によると、数値の見方は有用であるが、それを大規模に生成することは困難である。というのも、ある類推が他の類推よりも有用である理由を特定することは困難であり、また、何が最も有用であるかは、ある数値が現れる文脈によって異なる可能性があるからである。ここでは、ルールベースのアプローチ、クラウドソーシングによるシステム、ウィキペディアのデータと意味的類似性(BERTエンベッディングによる)を利用してコンテキスト固有のパースペクティブを生成するモデルという、大規模なパースペクティブ生成のための3つの方針を提示し、比較する。我々は、これらの3つのアプローチの組み合わせが、単一の方法を圧倒し、異なるアプローチが異なる設定で優れており、ユーザーがアプローチ間で異質な好みを示すことを発見した。最後に、広く使われているオンラインワードプロセッサにおけるパースペクティブの展開について述べる。

要約(オリジナル)

Numerical perspectives help people understand extreme and unfamiliar numbers (e.g., \$330 billion is about \$1,000 per person in the United States). While research shows perspectives to be helpful, generating them at scale is challenging both because it is difficult to identify what makes some analogies more helpful than others, and because what is most helpful can vary based on the context in which a given number appears. Here we present and compare three policies for large-scale perspective generation: a rule-based approach, a crowdsourced system, and a model that uses Wikipedia data and semantic similarity (via BERT embeddings) to generate context-specific perspectives. We find that the combination of these three approaches dominates any single method, with different approaches excelling in different settings and users displaying heterogeneous preferences across approaches. We conclude by discussing our deployment of perspectives in a widely-used online word processor.

arxiv情報

著者 Hancheng Cao,Sofia Eleni Spatharioti,Daniel G. Goldstein,Jake M. Hofman
発行日 2023-08-03 04:35:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.CY, cs.HC パーマリンク