ValiTex — a unified validation framework for computational text-based measures of social science constructs


この論文では、学者がテキストデータに基づいて社会科学の構成を有効に測定できるように設計された新しい検証フレームワークである ValiTex を紹介します。
ValiTex は、研究者に 3 種類の妥当性証拠を証明するよう指示しています。すなわち、実質的証拠 (測定の理論的基礎の概要を説明する)、構造的証拠 (テキスト モデルとその出力の特性を調べる)、および外部証拠 (測定が独立したデータとどのように関係するかをテストする) です。
ValiTex は、フレームワークに加えて、さまざまなユースケースに適応できるチェックリストを通じて、貴重な実践的なガイダンスを提供します。


Guidance on how to validate computational text-based measures of social science constructs is fragmented. While scholars generally acknowledge the importance of validating their text-based measures, they often lack common terminology and a unified framework to do so. This paper introduces ValiTex, a new validation framework designed to assist scholars in validly measuring social science constructs based on textual data. ValiTex prescribes researchers to demonstrate three types of validity evidence: substantive evidence (outlining the theoretical underpinning of the measure), structural evidence (examining the properties of the text model and its output), and external evidence (testing for how the measure relates to independent information). In addition to the framework, ValiTex offers valuable practical guidance through a checklist that is adaptable for different use cases. The checklist clearly defines and outlines specific validation steps while also offering a knowledgeable evaluation of the importance of each validation step to establish validity. We demonstrate the utility of the framework by applying it to a use case of detecting sexism from social media data.


著者 Lukas Birkenmaier,Claudia Wagner,Clemens Lechner
発行日 2023-10-04 15:34:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク