Investigating the Nature of Disagreements on Mid-Scale Ratings: A Case Study on the Abstractness-Concreteness Continuum


人間は、極端な場合のスケールでの評価に強く同意する傾向があります (たとえば、CAT が非常に具体的であると判断される) が、中程度のスケールの単語の判断では不一致が多くなります。
私たちの研究は具体性の評価に焦点を当てており、(i) 相関関係と教師あり分類を実装して中規模の単語の顕著な多峰性の特徴を特定し、(ii) ハード クラスタリングを適用して評価者間の体系的な不一致のパターンを特定します。


Humans tend to strongly agree on ratings on a scale for extreme cases (e.g., a CAT is judged as very concrete), but judgements on mid-scale words exhibit more disagreement. Yet, collected rating norms are heavily exploited across disciplines. Our study focuses on concreteness ratings and (i) implements correlations and supervised classification to identify salient multi-modal characteristics of mid-scale words, and (ii) applies a hard clustering to identify patterns of systematic disagreement across raters. Our results suggest to either fine-tune or filter mid-scale target words before utilising them.


著者 Urban Knupleš,Diego Frassinelli,Sabine Schulte im Walde
発行日 2023-11-08 09:52:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク